A Google spam-frissítése eléri az AI-válaszokat. A végrehajtás nehéz

A Google megkezdte a júniusi spam-frissítés bevezetését, az év másodikán. Dokumentált levélszemét-irányelveket kényszerít ki, és ezek egyike ma már több területet fed le, mint korábban.

A Google spamszabályai szabálysértésként kezelik a „generatív mesterségesintelligencia-válaszok manipulálására” irányuló kísérleteket a Keresésben, és ez az egyik irányelv, amelyet a frissítés betart.

A 404 Media által átvett Cornell Tech előnyomtatása rávilágít arra, hogy miért nehezebb az irányelvet betartatni, mint ahogyan azt a szövege sugallja. A közösségi oldalak, amelyekre az AI-kutatók támaszkodnak, harmadik felektől származó megjegyzéseket is tartalmazhatnak, és egy megjegyzés olyan ajánlást is tartalmazhat, amelyet a szerző soha nem írt.

Ezért amit a Google spamnek jelöl, az pontosan azon a visszakeresésen keresztül halad át, amelyre ezek az ügynökök támaszkodnak. A kutatások azt mutatják, hogy a nyilvánvaló védekezésnek vannak hátrányai is.

Azok számára, akik megpróbálnak egy márkát belenyomni a mesterséges intelligencia által generált válaszokba, tudják, hogy az optimalizálás és a spam közötti határvonal újrarajzolódik.

A tét

Az SE Ranking az AI mód nyomon követése során azt találta, hogy a Google egyre inkább a saját tulajdonságaira mutat rá, legutóbbi jelentésében pedig az AI módra vonatkozó idézetek nagyjából ötödét idézi.

Mivel több hivatkozás mutat a Google-ra és kevesebb a külső webhelyekre, ennek megfelelően nő a gyártási kedv.

A szürke piac már elkezdett kialakulni, és a Cornell szerzői rámutatnak, hogy a marketingszakemberek el vannak foglalva azzal, hogy teszteljék a mesterséges intelligencia által generált válaszok elmozdításának módjait.

Eközben a vállalkozások nem rendelkeznek a szükséges adatokkal, hogy lássák, mi történik. Amint az ügynökkereséssel kapcsolatos korábbi tudósításunk kifejtette, egyetlen irányítópult sem árulja el a webhelynek, hogy mesterséges intelligencia-válaszban landolt-e, idézték-e egy generált jelentésben, vagy átkerült-e.

Az eredmény egy szabálysértés, amelyet a Google meg tud nevezni, de az érintett webhely gyakran nem látja.

Mit talált a kutatás

A „Mélyreható kutatók megmérgezhetők a felhasználók által generált tartalmakon keresztül” című tanulmány, amelyet nem vizsgáltak le szakértői értékelésben, az AI-kutatóeszközök gyenge pontját kutatják a forrásaik gyűjtésében. Ezek az eszközök úgy válaszolnak egy kérdésre, hogy egy csomó kapcsolódó allekérdezést indítanak el, megragadják a folyamatosan rájuk eső oldalakat, és összeállítanak egy jelentést idézetekkel.

Az elemzés kimutatta, hogy ugyanazok a közösségi oldalak ismételten felbukkantak ezekben az allekérdezésekben. Egyetlen témacsoporton belül a lekérdezések 48%-ában egy felhasználó által generált oldal jelent meg, és a felhasználók által generált platformok tették ki az összes lekért URL 17-23%-át. Változtassa meg az ismétlődő oldalak egyikét, és a változás begyűrűzhet egy egész téma jelentésébe.

A szerzők úgy találták, hogy nagyjából 13 szónyi szöveg egy ismétlődő oldalon elegendő volt ahhoz, hogy a támadó által kiválasztott entitást beillessze a kész jelentésbe az oldalt lekérő munkamenetek 38-51%-ában.

Szórja szét ugyanazt a szöveget néhány oldalon, és ez a szám 42%-ról 62%-ra emelkedett. Még egy teljes oldalon eltemetve is, ahol az ügynök által olvasottaknak kevesebb mint 4%-a volt, az elültetett szöveg a munkamenetek 30-53%-ában még mindig a felszínre került.

Három nyílt forráskódú kutatóügynök végezte el a teszteket, a STORM, a Co-STORM és az OmniThink, amelyek mindegyike szimulációban futott, így az élő weben semmi sem érintett.

Ahol nehéz a végrehajtás

A Google az AI-válasz manipulációját spamnek minősítheti, és az elkapott dolgok alapján cselekedhet. Elkapni a nehéz rész. Az elültetett szöveg valódi tanácsként olvasható, és ugyanazokon az oldalakon található, amelyeket az eszközök mindig is olvastak, így a fő probléma az, hogy megkülönböztessük egy normál bejegyzéstől.

A kutatócsoport védekezést keresett az elültetett szöveg ellen, de nem talált. Megpróbálták kivágni a felhasználók által generált forrásokat, átvizsgálták őket egy nyelvi modellel használat előtt, és a kész jelentést átfésülték olyan állítások után kutatva, amelyek nem helytállóak.

A három közül egyik sem állította le a támadást anélkül, hogy ne rontotta volna az eredményeket a felhasználó számára. Hagyja el a felhasználók által generált forrásokat, és elveszíti azokat a közösségi részleteket, amelyek miatt érdemes használni az AI-keresőeszközöket.

A legtöbb ember által használt eszközök kívül esnek a teszten. A ChatGPT Deep Research és a Gemini Deep Research lekérdezése során a kutatók nem tudtak mérgezni anélkül, hogy átléptek volna egy etikai határt, ezért csak az idézési szokásokat mérték. A Gemini az esetek 12,1%-ában a felhasználók által létrehozott tartalomra támaszkodott, amit a szerzők az expozíció utalásának neveznek, nem pedig egy tesztelt eredménynek. Az OpenAI eszköze sokkal kevésbé nyúlt hozzá.

Miért fontos ez a kereső szakemberek számára?

Azok a lépések, amelyek segíthetnek egy márkát a mesterséges intelligencia válaszaiba emelni, hasonlóak a Google által „spamnek” nevezett manipulációs taktikákhoz, mint például a megemlítések elhelyezése azokon a webhelyeken, amelyeket ezek az eszközök olvasnak. Nem tudjuk, hol húzódik a Google határa az említés megszerzése és a tervezés között.

Az e-kereskedelem és a helyi márkák esetében a veszély a másik irányból ered.

A tesztesetek azok a hétköznapi dolgok voltak, amelyeket az emberek megkérdeznek, például, hogy melyik szolgáltatást hívják fel, melyik terméket vásárolják meg és hol étkeznek. Egy rivális vagy egy csaló ismeretlen nevet csúsztathat ezekbe a válaszok közé, közvetlenül a törvényes lehetőségek mellé, és a kiszemelt márka soha nem fogja megtudni.

A hírkiadók és a nagyobb márkák számára az aggodalomra ad okot, hogy bízzanak a nevükben kapott válaszban. Egy mesterséges intelligencia-eszköz idézetét nyerésnek tekintik, de az idézet csak azt tükrözi, amit az eszköz hozott, nem azt, hogy az oldal helyes volt-e, és a választ a márka által soha nem írt tartalom irányíthatja.

Ennek az egésznek nincs rendes megoldása. A mesterséges intelligencia láthatósága olyan felületté vált, amelyet aktívan figyelsz, nem csak egy csatornává, amelyre passzívan optimalizálsz.

Előre tekintve

A szerzők a felhasználók által generált manipulációt nyitott problémának nevezték, amelyet egyetlen platform sem képes önmagában megoldani. A Reddit megjelölte az összehangolt manipuláció elleni hosszú távú harcát, a Google pedig kontextuscímkéket ragasztott néhány Reddit-forrású anyagra az AI áttekintésekben. Egyik sem érinti azt a visszakeresési koncentrációt, amelyre a papír mutat.

A Google nem jelezte, hogyan kívánja érvényesíteni a generatív mesterséges intelligencia manipulációját, akár egy dedikált frissítésen, akár a SpamBrain rendszerén és a legtöbb szabálysértésnél a kézi felülvizsgálaton keresztül.

Egyelőre a szabályzat határokon kívülre hívja a viselkedést, és az AI-válaszok ellenőrzése továbbra is annak a feladata, aki elolvassa azokat.