A Google közzétett egy kutatási tanulmányt egy olyan kihívást jelentő adatkészlet létrehozásáról, amely az AI-ügynökök mélyreható kutatásra való képzését szolgálja. A cikk betekintést nyújt az ügynöki mesterséges intelligencia mélyreható kutatásának működésébe, amely betekintést enged a tartalom optimalizálásához.
A SAGE mozaikszó a Steerable Agentic Data Generation for Deep Search with Execution Feedback rövidítése.
Szintetikus kérdés és válasz párok
A kutatók megjegyezték, hogy a korábbi korszerű AI képzési adatkészletek (mint például a Musique és a HotpotQA) legfeljebb négy érvelési lépést igényeltek a kérdések megválaszolásához. A kérdés megválaszolásához szükséges keresések számát tekintve a Musique átlagosan 2,7 keresést végzett kérdésenként, a HotpotQA pedig 2,1 keresést. Egy másik gyakran használt adatkészlet, a Natural Questions (NQ) csak átlagosan 1,3 keresést igényelt kérdésenként.
Ezek az AI-ügynökök képzésére használt adatkészletek képzési hézagot teremtettek a mély keresési feladatokhoz, amelyek több érvelési lépést és több keresést igényeltek. Hogyan képezhet ki egy MI-ügynököt a valós világban végzett összetett mélykeresési feladatokra, ha az AI-ügynököket nem képezték ki igazán nehéz kérdések megválaszolására.
A kutatók létrehoztak egy SAGE nevű rendszert, amely automatikusan generál kiváló minőségű, összetett kérdés-válasz párokat az AI keresőügynökök képzéséhez. A SAGE egy „kettős ügynök” rendszer, ahol az egyik AI felír egy kérdést, egy másik „keresőügynök” pedig megpróbálja megoldani, visszajelzést adva a kérdés összetettségéről.
- Az első mesterséges intelligencia célja egy olyan kérdés megírása, amelynek megválaszolása nagy kihívást jelent, és amelynek megoldása sok érvelési lépést és több keresést igényel.
- A második mesterséges intelligencia célja annak mérése, hogy a kérdés megválaszolható-e, és kiszámolja, mennyire nehéz (minimális keresési lépések száma).
A SAGE kulcsa az, hogy ha a második mesterséges intelligencia túl könnyen megoldja a kérdést, vagy rosszul oldja meg, akkor az általa talált konkrét lépéseket és dokumentumokat (a végrehajtási nyomot) visszacsatolják az első MI-hez. Ez a visszajelzés lehetővé teszi az első mesterséges intelligencia számára, hogy azonosítsa a négy parancsikon egyikét, amelyek lehetővé teszik a második mesterséges intelligencia számára, hogy kevesebb lépésben megoldja a kérdést.
Ezek a parancsikonok nyújtanak betekintést abba, hogyan lehet jobb rangsorolni a mélyreható kutatási feladatokat.
Négy módja annak, hogy a mélyreható kutatást elkerülték
A dolgozat célja olyan kérdés-válasz párok létrehozása volt, amelyek olyan nehézkesek voltak, hogy az AI-ügynöknek több lépésbe telt a megoldása. A visszajelzések négy olyan módot mutattak be, amelyek kevésbé tették szükségessé az AI-ügynöknek további kereséseket a válasz megtalálásához.
Négy ok, amiért a mélyreható kutatás szükségtelen volt
- Információk Társhely
Ez a leggyakoribb parancsikon, amely az esetek 35%-át teszi ki, amikor nem volt szükség mélyreható kutatásra. Ez akkor fordul elő, ha egy kérdés megválaszolásához szükséges két vagy több információ ugyanabban a dokumentumban található. Ahelyett, hogy kétszer keresne, az AI mindkét választ egyetlen „ugrással” találja meg. - Többlekérdezés összecsukása
Ez az esetek 21%-ában történt. Ennek oka az, hogy egyetlen, okos keresési lekérdezés elegendő információt kér le különböző dokumentumokból a probléma több részének egyidejű megoldásához. Ez egyetlen lépésben „összeomolja” azt, amit egy többlépcsős folyamatnak kellett volna lennie. - Felületi komplexitás
Ez az esetek 13%-át teszi ki, amikor nem volt szükség mélyreható kutatásra. A kérdés az ember számára hosszúnak és bonyolultnak tűnik, de egy keresőmotor (amelyet egy AI-ügynök használ) azonnal ráugorhat a válaszra, anélkül, hogy a közbenső lépéseken keresztül kellene érvelnie. - Túlzottan konkrét kérdések
A kudarcok 31%-a olyan sok részletet tartalmazó kérdés, hogy a válasz már az első keresés során nyilvánvalóvá válik, így nincs szükség „mély” vizsgálatra.
A kutatók azt találták, hogy néhány kérdés nehéznek tűnik, de valójában viszonylag egyszerű, mivel az információ egy dokumentumban „együtt található”. Ha egy ügynök 1 ugrással tud válaszolni egy 4 ugrásos kérdésre, mert egy webhely elég átfogó volt ahhoz, hogy minden választ megtaláljon, akkor ez az adatpont kudarcnak minősül az ügynök érvelésre való képzésében, de ez még mindig megtörténhet a való életben, és az ügynök kihasználja, hogy minden információt egy oldalon talál.
SEO elvihető
Némi betekintést nyerhet abba, hogy milyen tartalom felel meg a mélyreható kutatásnak. Noha ezek nem feltétlenül az ügynöki mesterséges intelligencia mélykeresésben való jobb helyezést célzó taktikák, ezek a betekintések megmutatják, milyen forgatókönyvek okozták az AI-ügynököknek, hogy az összes vagy a legtöbb választ egyetlen weboldalon találják meg.
Az „információs helymegosztás” SEO győzelem lehet
A kutatók azt találták, hogy ha egy kérdés megválaszolásához több információ is előfordul ugyanabban a dokumentumban, az csökkenti a keresési lépések számát. Egy kiadó számára ez azt jelenti, hogy a „szétszórt” tényeket egyetlen oldalon összevonja, és megakadályozza, hogy az AI-ügynöknek egy versenytárs webhelyére kelljen „ugrania”, hogy megtalálja a többi választ.
A „többlekérdezés összecsukása” aktiválása
A szerzők egy olyan jelenséget azonosítottak, ahol a különböző dokumentumokból származó információk egyetlen lekérdezéssel kinyerhetők. Ha a tartalmat úgy strukturálja, hogy egyszerre több részkérdésre is válaszoljon, lehetővé teszi, hogy az ügynök gyorsabban megtalálja a teljes megoldást az Ön oldalán, hatékonyan „rövidre zárva” azt a hosszú érvelési láncot, amelyre az ügynök felkészült.
A „parancsikonok” megszüntetése (az érvelési hiányosság)
A tanulmány megjegyzi, hogy az adatgenerátor meghibásodik, ha véletlenül létrehoz egy „parancsikont” a válaszhoz. SEO-sként az Ön célja az, hogy ez a parancsikon legyen – olyan konkrét adatpontok megadása, mint a számítások, dátumok vagy nevek, amelyek lehetővé teszik az ügynök számára, hogy további feltárás nélkül elérje a végső választ.
A cél továbbra is a helyezés a klasszikus keresésben
A keresőoptimalizálás és a kiadó számára ezek a billentyűparancsok aláhúzzák az átfogó dokumentum létrehozásának értékét, mivel ez megszünteti annak szükségességét, hogy egy mesterséges intelligenciaügynök máshová ugorjon. Ez nem jelenti azt, hogy hasznos lenne az összes információt egy oldalon feltüntetni. Ha a felhasználó számára logikus, hasznos lehet linkelni az egyik oldalról a másikra a kapcsolódó információkért.
Azért mondom ezt, mert az AI-ügynök klasszikus keresést végez a válaszok után, így a cél továbbra is az, hogy egy weboldalt a klasszikus keresésre optimalizáljanak. Ezen túlmenően ebben a kutatásban az AI-ügynök minden végrehajtott lekérdezéshez az első három rangsorolt weboldalról gyűjti le. Nem tudom, hogy így működik-e az ügynöki mesterséges intelligencia keresés élő környezetben, de ezt meg kell fontolni.
Valójában a kutatók egyik tesztjét a Serper API segítségével végezték el, hogy a keresési eredményeket kinyerjék a Google-tól.
Tehát, amikor az ügynöki mesterséges intelligencia keresésben való rangsorolásról van szó, vegye figyelembe az alábbi szempontokat:
- Hasznos lehet átgondolni az első háromba kerülés fontosságát.
- Optimalizálja a weboldalakat a klasszikus kereséshez.
- Ne optimalizálja a weboldalakat mesterséges intelligencia keresésre
- Ha lehetséges, hogy átfogó legyen, maradjon a témánál, és az első három közé kerüljön, akkor tegye ezt.
- A releváns oldalakra mutató hivatkozások segítik őket a klasszikus keresésben, lehetőleg az első három között (a biztonság kedvéért).
Előfordulhat, hogy az ügynöki mesterséges intelligencia-keresés több mint a klasszikus keresés első három helyéből való kilépést fontolgatja. De hasznos lehet, ha azt a célt tűzi ki, hogy az első 3 közé kerüljön a klasszikus keresésben, és más oldalak rangsorolására összpontosítson, amelyek a többugrásos mélykutatás részét képezhetik.
A kutatási tanulmányt a Google 2026. január 26-án tette közzé. PDF formátumban érhető el: SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback.
