A Google spam-frissítése eléri az AI-válaszokat. A végrehajtás nehéz

Peter

A Google megkezdte a júniusi spam-frissítés bevezetését, az év másodikán. Dokumentált levélszemét-irányelveket kényszerít ki, és ezek egyike ma már több területet fed le, mint korábban.

A Google spamszabályai szabálysértésként kezelik a „generatív mesterségesintelligencia-válaszok manipulálására” irányuló kísérleteket a Keresésben, és ez az egyik irányelv, amelyet a frissítés betart.

A 404 Media által átvett Cornell Tech előnyomtatása rávilágít arra, hogy miért nehezebb az irányelvet betartatni, mint ahogyan azt a szövege sugallja. A közösségi oldalak, amelyekre az AI-kutatók támaszkodnak, harmadik felektől származó megjegyzéseket is tartalmazhatnak, és egy megjegyzés olyan ajánlást is tartalmazhat, amelyet a szerző soha nem írt.

Ezért amit a Google spamnek jelöl, az pontosan azon a visszakeresésen keresztül halad át, amelyre ezek az ügynökök támaszkodnak. A kutatások azt mutatják, hogy a nyilvánvaló védekezésnek vannak hátrányai is.

Azok számára, akik megpróbálnak egy márkát belenyomni a mesterséges intelligencia által generált válaszokba, tudják, hogy az optimalizálás és a spam közötti határvonal újrarajzolódik.

A tét

Az SE Ranking az AI mód nyomon követése során azt találta, hogy a Google egyre inkább a saját tulajdonságaira mutat rá, legutóbbi jelentésében pedig az AI módra vonatkozó idézetek nagyjából ötödét idézi.

Mivel több hivatkozás mutat a Google-ra és kevesebb a külső webhelyekre, ennek megfelelően nő a gyártási kedv.

A szürke piac már elkezdett kialakulni, és a Cornell szerzői rámutatnak, hogy a marketingszakemberek el vannak foglalva azzal, hogy teszteljék a mesterséges intelligencia által generált válaszok elmozdításának módjait.

Eközben a vállalkozások nem rendelkeznek a szükséges adatokkal, hogy lássák, mi történik. Amint az ügynökkereséssel kapcsolatos korábbi tudósításunk kifejtette, egyetlen irányítópult sem árulja el a webhelynek, hogy mesterséges intelligencia-válaszban landolt-e, idézték-e egy generált jelentésben, vagy átkerült-e.

Az eredmény egy szabálysértés, amelyet a Google meg tud nevezni, de az érintett webhely gyakran nem látja.

Mit talált a kutatás

A „Mélyreható kutatók megmérgezhetők a felhasználók által generált tartalmakon keresztül” című tanulmány, amelyet nem vizsgáltak le szakértői értékelésben, az AI-kutatóeszközök gyenge pontját kutatják a forrásaik gyűjtésében. Ezek az eszközök úgy válaszolnak egy kérdésre, hogy egy csomó kapcsolódó allekérdezést indítanak el, megragadják a folyamatosan rájuk eső oldalakat, és összeállítanak egy jelentést idézetekkel.

Az elemzés kimutatta, hogy ugyanazok a közösségi oldalak ismételten felbukkantak ezekben az allekérdezésekben. Egyetlen témacsoporton belül a lekérdezések 48%-ában egy felhasználó által generált oldal jelent meg, és a felhasználók által generált platformok tették ki az összes lekért URL 17-23%-át. Változtassa meg az ismétlődő oldalak egyikét, és a változás begyűrűzhet egy egész téma jelentésébe.

A szerzők úgy találták, hogy nagyjából 13 szónyi szöveg egy ismétlődő oldalon elegendő volt ahhoz, hogy a támadó által kiválasztott entitást beillessze a kész jelentésbe az oldalt lekérő munkamenetek 38-51%-ában.

Szórja szét ugyanazt a szöveget néhány oldalon, és ez a szám 42%-ról 62%-ra emelkedett. Még egy teljes oldalon eltemetve is, ahol az ügynök által olvasottaknak kevesebb mint 4%-a volt, az elültetett szöveg a munkamenetek 30-53%-ában még mindig a felszínre került.

Három nyílt forráskódú kutatóügynök végezte el a teszteket, a STORM, a Co-STORM és az OmniThink, amelyek mindegyike szimulációban futott, így az élő weben semmi sem érintett.

Ahol nehéz a végrehajtás

A Google az AI-válasz manipulációját spamnek minősítheti, és az elkapott dolgok alapján cselekedhet. Elkapni a nehéz rész. Az elültetett szöveg valódi tanácsként olvasható, és ugyanazokon az oldalakon található, amelyeket az eszközök mindig is olvastak, így a fő probléma az, hogy megkülönböztessük egy normál bejegyzéstől.

A kutatócsoport védekezést keresett az elültetett szöveg ellen, de nem talált. Megpróbálták kivágni a felhasználók által generált forrásokat, átvizsgálták őket egy nyelvi modellel használat előtt, és a kész jelentést átfésülték olyan állítások után kutatva, amelyek nem helytállóak.

A három közül egyik sem állította le a támadást anélkül, hogy ne rontotta volna az eredményeket a felhasználó számára. Hagyja el a felhasználók által generált forrásokat, és elveszíti azokat a közösségi részleteket, amelyek miatt érdemes használni az AI-keresőeszközöket.

A legtöbb ember által használt eszközök kívül esnek a teszten. A ChatGPT Deep Research és a Gemini Deep Research lekérdezése során a kutatók nem tudtak mérgezni anélkül, hogy átléptek volna egy etikai határt, ezért csak az idézési szokásokat mérték. A Gemini az esetek 12,1%-ában a felhasználók által létrehozott tartalomra támaszkodott, amit a szerzők az expozíció utalásának neveznek, nem pedig egy tesztelt eredménynek. Az OpenAI eszköze sokkal kevésbé nyúlt hozzá.

Miért fontos ez a kereső szakemberek számára?

Azok a lépések, amelyek segíthetnek egy márkát a mesterséges intelligencia válaszaiba emelni, hasonlóak a Google által „spamnek” nevezett manipulációs taktikákhoz, mint például a megemlítések elhelyezése azokon a webhelyeken, amelyeket ezek az eszközök olvasnak. Nem tudjuk, hol húzódik a Google határa az említés megszerzése és a tervezés között.

Az e-kereskedelem és a helyi márkák esetében a veszély a másik irányból ered.

A tesztesetek azok a hétköznapi dolgok voltak, amelyeket az emberek megkérdeznek, például, hogy melyik szolgáltatást hívják fel, melyik terméket vásárolják meg és hol étkeznek. Egy rivális vagy egy csaló ismeretlen nevet csúsztathat ezekbe a válaszok közé, közvetlenül a törvényes lehetőségek mellé, és a kiszemelt márka soha nem fogja megtudni.

A hírkiadók és a nagyobb márkák számára az aggodalomra ad okot, hogy bízzanak a nevükben kapott válaszban. Egy mesterséges intelligencia-eszköz idézetét nyerésnek tekintik, de az idézet csak azt tükrözi, amit az eszköz hozott, nem azt, hogy az oldal helyes volt-e, és a választ a márka által soha nem írt tartalom irányíthatja.

Ennek az egésznek nincs rendes megoldása. A mesterséges intelligencia láthatósága olyan felületté vált, amelyet aktívan figyelsz, nem csak egy csatornává, amelyre passzívan optimalizálsz.

Előre tekintve

A szerzők a felhasználók által generált manipulációt nyitott problémának nevezték, amelyet egyetlen platform sem képes önmagában megoldani. A Reddit megjelölte az összehangolt manipuláció elleni hosszú távú harcát, a Google pedig kontextuscímkéket ragasztott néhány Reddit-forrású anyagra az AI áttekintésekben. Egyik sem érinti azt a visszakeresési koncentrációt, amelyre a papír mutat.

A Google nem jelezte, hogyan kívánja érvényesíteni a generatív mesterséges intelligencia manipulációját, akár egy dedikált frissítésen, akár a SpamBrain rendszerén és a legtöbb szabálysértésnél a kézi felülvizsgálaton keresztül.

Egyelőre a szabályzat határokon kívülre hívja a viselkedést, és az AI-válaszok ellenőrzése továbbra is annak a feladata, aki elolvassa azokat.


A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.