Az Agent Runtime Wars ezen a héten kezdődött

Peter

Az ügynök futtatókörnyezete az új böngészőréteg, és a webhelyet a futtatókörnyezet alapján értékelik ki, nem pedig az egyes modellek alapján.

Ez olyan változás, amelyet a webes szakemberek még nem tettek meg. A beszélgetés továbbra is modellek köré szerveződik. Melyik modell ír jobban? Melyik idéz pontosabban? Melyik API-ja olcsóbb ebben a hónapban? A modellbeszélgetés azért hangos, mert néhány hetente érkezik az új modell, és minden megjelenés mozikba kerül.

Az érdekes történet az alatta található. Az alapot újjáépítik. Ezen a héten lehetetlen volt figyelmen kívül hagyni.

A Runtime Stack kiszállítása áprilisban történt

Április 15-én a Cloudflare bemutatta a Project Think-et, egy új Agents SDK-t, amely tartós végrehajtásra épül összeomlás-helyreállítással és ellenőrzési pontokkal, izolált gyermekként futó al-ügynökökkel, állandó munkamenetekkel fastruktúrájú üzenetekkel, valamint a Dynamic Workers-en futó sandbox-kódvégrehajtással. Ugyanazon a napon néhány órán belül az OpenAI kiadta az Agents SDK következő fejlesztését natív sandbox-végrehajtással és modell-natív kábelköteggel. A weben két legnagyobb infrastruktúra-üzemeltető versengő válaszokat adott ugyanarra a kérdésre, és a kérdés az volt: hogyan működik valójában egy régóta működő AI-ügynök a termelésben?

Aztán április 16-án a Cloudflare további öt darabot adott hozzá. AI Platform: szállító-agnosztikus következtetési réteg, amely modelleket irányít az ügynökök számára. AI Search: egy vektorindex plusz darabolási folyamat, amelyet kifejezetten ügynöklekérésre szánt felügyelt termékként szállítanak, amely a Pinecone-nal és az Algoliával versenyez az ügynökoldali RAG-rétegben, nem pedig a Google AI-móddal. E-mail szolgáltatás nyilvános bétaverzióban, úgy tervezték, hogy az ügynökök a világ leguniverzálisabb felületét használhassák csatornaként. PlanetScale Postgres és MySQL belül Workers. És a mérnöki alap a nagyon nagy, nyílt forráskódú LLM-eknek, mint például a Kimi K2.5, közvetlenül a Cloudflare hálózatán.

Sundar Pichai ugyanezt a váltást írta le egy héttel korábban. Az április 7-i Cheeky Pint podcastban a Stripe társalapítójával, John Collisonnal magát a Search-ot „ügynökmenedzsernek” nevezte: „A legtöbb információszerzési lekérdezés ügynöki lesz a Keresésben. Feladatokat fog végrehajtani. Sok szál fut majd.” Lekérdezésenként sok szál a Keresés futásidejű leírása. A Google vezérigazgatója ugyanarra a szubsztrátumra mutatott rá, mint a Cloudflare és az OpenAI, amelyet ezen a héten szállítottak.

Ha az OpenClaw az ügynökweb volt a fogyasztók számára (lejátszható demó, érdekes prototípus, valami gesztus), akkor ez az ügynökweb felnőtteknek. Tartós. Sandboxed. Ellenőrizhető. Az a fajta infrastruktúra, amelyen ténylegesen üzletet vezetne.

A minta az egészben egy dolog: a futásidő. Nem a modell. Nem a fogyasztói csevegőalkalmazás. Nem a vitaindító dia. A futási idő az a réteg, ahol az ügynökök felpörögnek, órákon és napokon át fennmaradnak, adott fájlrendszer-hozzáféréssel, adott hálózati hozzáféréssel, adott memóriával. A futtatókörnyezet az a réteg, amely eldönti, hogy az ügynök munkamenete túlél-e egy összeomlást, hogy az alügynökei megfontolhatók-e, tartalmaz-e kódvégrehajtást.

A rossz kérdés és az új

A webes szakemberek az elmúlt 18 hónapot azzal töltötték, hogy rossz kérdést tettek fel. A kérdés az volt: melyik AI modellre optimalizáljunk? ChatGPT vagy Claude vagy Gemini vagy Perplexity. Kinek az idézete a fontosabb? Kinek a bejáróját engedjük át? Ennek a beszélgetésnek akkor volt értelme, amikor a modellek közvetlenül olvasták az Ön webhelyét.

Már nem. A modell azt olvassa be, amit a futási környezet átad neki. A futási környezet lekérte az oldalt. A futási környezet elemezte. A futási környezet végrehajtotta (vagy nem hajtotta végre) a JavaScriptet. A futási környezet feloldotta a strukturált adatokat. A futásidejű egyeztetett hitelesítés. Mire a modell bármit is lát a webhelyről, már látja a futási környezet értelmezését is.

Az új kérdés, ha komolyan veszi ezt a hetet, az, hogy webhelye melyik ügynöki futtatókörnyezet számára olvasható. Három dolgot kell tesztelni a jövő hét előtt:

  1. A legfontosabb végpontjai géppel olvasható strukturált válaszokat adnak vissza, vagy csak a teljes böngészőmunkameneten belül jelennek meg helyesen?
  2. A hitelesítés hatóköre úgy van meghatározva, hogy a felhasználó nevében eljáró ügynök több híváson keresztül tarthasson munkamenetet, vagy csak az egyszeri emberi bejelentkezést támogatja?
  3. A strukturált adatok továbbra is ugyanazt jelentik, ha egy futási környezet, amely nem hajtotta végre a JavaScriptet, megpróbálta beolvasni?

Ezek futásidejű olvashatósággal kapcsolatos kérdések. A modellnek semmi köze hozzájuk. A futási környezet eldönti, hogy a válasz egyenletes-e a modell környezeti ablakában, és a modell a futási környezet által átadott elemekből választ.

A web vízvezetékeinek átépítése folyamatban van. A következő két évben minden modell ezen futási idők valamelyikén keresztül fogja látni a webhelyét, nem közvetlenül. Az Ön webhelyének most kezdődő feladata az, hogy olvasható legyen a futtatókörnyezet számára.

A modellbeszélgetés továbbra is a konferencia színpadain és a vitaindító diákon fog zajlani. A futásidejű beszélgetés az infrastrukturális vállalatok termékváltoztatási naplóiban zajlik. A futtatókörnyezetet szállító vállalatok döntik el, hogy mely webhelyeket éri el az AI-keresés és az AI-kereskedelem. Ne kérdezd, melyik modell. Kezdje el megkérdezni, melyik futási idő.


Ez a bejegyzés eredetileg a No Hacks oldalon jelent meg.


A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.