Az Agent Runtime Wars ezen a héten kezdődött

Az ügynök futtatókörnyezete az új böngészőréteg, és a webhelyet a futtatókörnyezet alapján értékelik ki, nem pedig az egyes modellek alapján.

Ez olyan változás, amelyet a webes szakemberek még nem tettek meg. A beszélgetés továbbra is modellek köré szerveződik. Melyik modell ír jobban? Melyik idéz pontosabban? Melyik API-ja olcsóbb ebben a hónapban? A modellbeszélgetés azért hangos, mert néhány hetente érkezik az új modell, és minden megjelenés mozikba kerül.

Az érdekes történet az alatta található. Az alapot újjáépítik. Ezen a héten lehetetlen volt figyelmen kívül hagyni.

A Runtime Stack kiszállítása áprilisban történt

Április 15-én a Cloudflare bemutatta a Project Think-et, egy új Agents SDK-t, amely tartós végrehajtásra épül összeomlás-helyreállítással és ellenőrzési pontokkal, izolált gyermekként futó al-ügynökökkel, állandó munkamenetekkel fastruktúrájú üzenetekkel, valamint a Dynamic Workers-en futó sandbox-kódvégrehajtással. Ugyanazon a napon néhány órán belül az OpenAI kiadta az Agents SDK következő fejlesztését natív sandbox-végrehajtással és modell-natív kábelköteggel. A weben két legnagyobb infrastruktúra-üzemeltető versengő válaszokat adott ugyanarra a kérdésre, és a kérdés az volt: hogyan működik valójában egy régóta működő AI-ügynök a termelésben?

Aztán április 16-án a Cloudflare további öt darabot adott hozzá. AI Platform: szállító-agnosztikus következtetési réteg, amely modelleket irányít az ügynökök számára. AI Search: egy vektorindex plusz darabolási folyamat, amelyet kifejezetten ügynöklekérésre szánt felügyelt termékként szállítanak, amely a Pinecone-nal és az Algoliával versenyez az ügynökoldali RAG-rétegben, nem pedig a Google AI-móddal. E-mail szolgáltatás nyilvános bétaverzióban, úgy tervezték, hogy az ügynökök a világ leguniverzálisabb felületét használhassák csatornaként. PlanetScale Postgres és MySQL belül Workers. És a mérnöki alap a nagyon nagy, nyílt forráskódú LLM-eknek, mint például a Kimi K2.5, közvetlenül a Cloudflare hálózatán.

Sundar Pichai ugyanezt a váltást írta le egy héttel korábban. Az április 7-i Cheeky Pint podcastban a Stripe társalapítójával, John Collisonnal magát a Search-ot „ügynökmenedzsernek” nevezte: „A legtöbb információszerzési lekérdezés ügynöki lesz a Keresésben. Feladatokat fog végrehajtani. Sok szál fut majd.” Lekérdezésenként sok szál a Keresés futásidejű leírása. A Google vezérigazgatója ugyanarra a szubsztrátumra mutatott rá, mint a Cloudflare és az OpenAI, amelyet ezen a héten szállítottak.

Ha az OpenClaw az ügynökweb volt a fogyasztók számára (lejátszható demó, érdekes prototípus, valami gesztus), akkor ez az ügynökweb felnőtteknek. Tartós. Sandboxed. Ellenőrizhető. Az a fajta infrastruktúra, amelyen ténylegesen üzletet vezetne.

A minta az egészben egy dolog: a futásidő. Nem a modell. Nem a fogyasztói csevegőalkalmazás. Nem a vitaindító dia. A futási idő az a réteg, ahol az ügynökök felpörögnek, órákon és napokon át fennmaradnak, adott fájlrendszer-hozzáféréssel, adott hálózati hozzáféréssel, adott memóriával. A futtatókörnyezet az a réteg, amely eldönti, hogy az ügynök munkamenete túlél-e egy összeomlást, hogy az alügynökei megfontolhatók-e, tartalmaz-e kódvégrehajtást.

A rossz kérdés és az új

A webes szakemberek az elmúlt 18 hónapot azzal töltötték, hogy rossz kérdést tettek fel. A kérdés az volt: melyik AI modellre optimalizáljunk? ChatGPT vagy Claude vagy Gemini vagy Perplexity. Kinek az idézete a fontosabb? Kinek a bejáróját engedjük át? Ennek a beszélgetésnek akkor volt értelme, amikor a modellek közvetlenül olvasták az Ön webhelyét.

Már nem. A modell azt olvassa be, amit a futási környezet átad neki. A futási környezet lekérte az oldalt. A futási környezet elemezte. A futási környezet végrehajtotta (vagy nem hajtotta végre) a JavaScriptet. A futási környezet feloldotta a strukturált adatokat. A futásidejű egyeztetett hitelesítés. Mire a modell bármit is lát a webhelyről, már látja a futási környezet értelmezését is.

Az új kérdés, ha komolyan veszi ezt a hetet, az, hogy webhelye melyik ügynöki futtatókörnyezet számára olvasható. Három dolgot kell tesztelni a jövő hét előtt:

A legfontosabb végpontjai géppel olvasható strukturált válaszokat adnak vissza, vagy csak a teljes böngészőmunkameneten belül jelennek meg helyesen?
A hitelesítés hatóköre úgy van meghatározva, hogy a felhasználó nevében eljáró ügynök több híváson keresztül tarthasson munkamenetet, vagy csak az egyszeri emberi bejelentkezést támogatja?
A strukturált adatok továbbra is ugyanazt jelentik, ha egy futási környezet, amely nem hajtotta végre a JavaScriptet, megpróbálta beolvasni?

Ezek futásidejű olvashatósággal kapcsolatos kérdések. A modellnek semmi köze hozzájuk. A futási környezet eldönti, hogy a válasz egyenletes-e a modell környezeti ablakában, és a modell a futási környezet által átadott elemekből választ.

A web vízvezetékeinek átépítése folyamatban van. A következő két évben minden modell ezen futási idők valamelyikén keresztül fogja látni a webhelyét, nem közvetlenül. Az Ön webhelyének most kezdődő feladata az, hogy olvasható legyen a futtatókörnyezet számára.

A modellbeszélgetés továbbra is a konferencia színpadain és a vitaindító diákon fog zajlani. A futásidejű beszélgetés az infrastrukturális vállalatok termékváltoztatási naplóiban zajlik. A futtatókörnyezetet szállító vállalatok döntik el, hogy mely webhelyeket éri el az AI-keresés és az AI-kereskedelem. Ne kérdezd, melyik modell. Kezdje el megkérdezni, melyik futási idő.

Ez a bejegyzés eredetileg a No Hacks oldalon jelent meg.