Az AI-keresés megeszi magát, és a SEO-ipar a forrás

Tavaly szeptemberben Lily Ray felkérte a Perplexityt a SEO-val és az AI-kereséssel kapcsolatos legfrissebb hírekre. Magabiztosan mesélt neki a „2025. szeptemberi „Perspektíva” alapalgoritmus-frissítésről; egy Google-frissítés, amely nem létezett, amint azt a „The AI Slop Loop”-ban hosszasan írta. A Google évek óta nem nevezte meg az alapvető frissítéseket. A „Perspektívák” már SERP szolgáltatás volt. Ha Ausztriában valós frissítés jelent meg, akkor a beérkező levelek üzenetei közölték volna vele, mielőtt Perplexity tette volna.

Megnézte az idézeteket. Mindketten a mesterséges intelligencia által generált bejegyzésekre mutattak a SEO ügynökségek blogjain: olyan webhelyekre, amelyek tartalomfolyamatot futtattak, hallucináltak egy frissítést, és jelentésként tették közzé. A tanácstalanság elolvasta a szót, forrásanyagként kezelte, és hírként szolgáltatta vissza neki.

Februárban a BBC munkatársa, Thomas Germain 20 percet töltött azzal, hogy blogbejegyzést írt személyes oldalán. A címe: „A hot dogot evő legjobb technológiai újságírók.” Az első helyre sorolta, kitalálta a 2026-os Dél-Dakotai Nemzetközi Hot Dog Bajnokságot, amely soha nem történt meg, és pontosan nem hivatkozott semmire. 24 órán belül a Google mesterséges intelligencia áttekintései és a ChatGPT is átadta a kitalációt mindenkinek, aki megkérdezte. Claude nem harapott. A Google és az OpenAI megtette.

Mindenki látta, aki megnézte.

Már korábban is vitatkoztam az Ouroborosról. Rosszul írtam az idővonalat

A probléma uralkodó megfogalmazása az volt modell összeomlása. Egy modellt webszövegre oktat, a web megtelik mesterséges intelligencia kimenettel, a következő modell egy egyre inkább saját kipufogóból készült korpuszon képződik, és végül az eloszlás kásává válik. Az innováció a kivételekből fakad, és a valószínűségi rendszerek, amelyek az átlag felé konvergálnak, tervezésüknél fogva gyengítik a kivételeket. Használtam a kifejezést digitális ouroboros erre.

Ez a keretezés edzési ciklusokat feltételez. Időt feltételez. Feltételezi, hogy a szennyeződés a modell kiadásának sebességével mozog.

Nem. Amit Lily dokumentált, amit Germain dokumentált, amit a New York Times aztán megírt és számszerűsített – ezek egyike sem képzési oldal. Az érintett modelleket nem képezték át a blogon megjelenő hallucinációk és az idézetekkel alátámasztott tények között. A szennyeződés kúszási sebességgel mozgott. Az ouroboros nem vesz el generációkat, hogy megegye magát. A lekérdezés idején felemészti magát, valahányszor valaki kérdést tesz fel az egyik ilyen rendszernek.

A cső, amit mindenki néz, nem az a cső, amelyik eltörik.

A megkülönböztetés, ami számít

A modell összeomlása egy képzési korpusz probléma. A szintetikus tartalom beszivárog a képzés előtti adatokba, a modell következő generációja örökli, a képesség leromlik. A kutatók két éve figyelmeztetnek erre. igazuk van. Valami olyan lassút is leírnak, ami elég lassú ahhoz, hogy mindenki komolyan bólintson, és folytassa a szállítást.

A szennyeződés visszanyerése gyorsabb és már itt is van. A RAG rendszerek – Perplexity, Google AI Overviews, ChatGPT kereséssel – nem generálnak válaszokat pusztán a parametrikus memóriából. Dokumentumokat töltenek le az élő webről, kontextusba helyezik őket, és válaszokat generálnak attól függően, hogy mit kerestek. Ha a retriever hallucinált SEO-bejegyzést tesz közzé, a válasz örökli a hallucinációt. Nincs szükség átképzésre.

Az ezzel kapcsolatos tudományos irodalom egyértelmű. PoisonedROG (Zou et al., 2024) kimutatták, hogy kis számú kialakított szövegrész beillesztése egy visszakereső korpuszba elegendő volt egy RAG-rendszer kimenetének vezérléséhez célzott lekérdezések esetén. BadRAG (Xue és mtsai, 2024) szemantikus hátsó ajtók használatával mutatták be ugyanezt a támadási osztályt. Mindkét dolgozat kontradiktórius problémaként kezeli ezt: mi történik, ha egy támadó szándékosan megmérgezi a korpuszt.

Germain és Lily véletlenül bebizonyította, hogy az ellenséges modell a normál működési modell. Nincs szükség kidolgozott ellenséges átjáróra. Szüksége van egy blogbejegyzésre. A nyílt web a korpusz, és bárki írhat rá, aki rendelkezik domainnel.

A New York Times megbízásából készült Oumi-elemzés számokat közöl arról, hogy ez mennyibe kerül. A 4326 SimpleQA teszt során a Google AI Overviews az esetek 85%-ában helyesen válaszolt a Gemini 2-n, 91%-ban a Gemini 3-on. A Google méreteiben – évente több mint ötbillió keresés – a 9%-os hibaarány még mindig tízmillió hibás választ jelent óránként. De a sokkal árulkodóbb adat a következő: a Gemini 3-on az 56%-a helyes a válaszok megalapozatlanok voltak, a Gemini 2 esetében ez az arány 37%. A frissítés javította a felület pontosságát, és rontotta az idézetek számát. Amikor a modellnek valami jól sikerült, az esetek több mint felében a forrás, amelyre hivatkozott, nem támasztotta alá az állítást.

A visszakereső réteg nem szűrő. Ez a fertőzés vektora.

Ki veti a Corpust

Az iparág, amely a leglelkesebben gyártotta – majd a leglelkesebben írt a fogyasztásának következményeiről – a SEO iparág. Korábban már írtam arról, hogy a tartalomskálázás csak a tartalom pörög a jobb nyelvtan mellett, és az AI láthatósági eszközkomplexumról, amely nem-determinisztikus rendszerek kimeneteiből épít fel irányítópultokat. Ez ugyanaz a hurok, egy réteggel mélyebb. Egy keresőoptimalizálási ügynökség mesterséges intelligencia-tartalmat üzemeltet, mivel az AI-áttekintések csökkentették ügyfeleik forgalmát. A csővezeték spekulatív „nyertesek és vesztesek” bejegyzéseket tesz közzé egy alapvető frissítés során, amely még mindig futó, semmire hivatkozva. Egy másik ügynökség csővezetéke ezeket veszi fel forrásként. A kimenet beáramlik a visszakeresési indexbe. Az AI Overviews ezek egyikét idézi. Az eredeti ügynökség ezután esettanulmányt ír arról, hogy az AI Overviews hogyan „hozza felszínre” a tartalmat.

Egy több mint 26 000 ChatGPT forrás URL-t vizsgáló Ahrefs-tanulmány megállapította, hogy a „legjobb X” listák az összes idézett oldaltípus közel 44%-át teszik ki, beleértve azokat az eseteket is, amikor a márkák első helyen állnak versenytársaikkal szemben. Harpreet Chatha azt mondta a BBC-nek, hogy közzéteheti „a legjobb vízálló cipőt 2026-ra”, saját magát helyezheti előtérbe, és napokon belül hivatkozhat az AI Overviews-ra és a ChatGPT-re. Lily a tényleges 2026. márciusi alapfrissítés során mesterséges intelligencia által generált cikkeket talált, amelyek azt állították, hogy a nyerteseket és a veszteseket sorolják fel, miközben a frissítés még kifutott; cikkek, amelyek kitöltéssel nyitottak, és egyetlen valódi idézet nélkül felsoroltak márkákat.

A mesterséges intelligencia tartalmát skálázó szakemberek a legközvetlenebbül is sérülnek, ha a mesterséges intelligencia keresőrendszerei tényként hivatkoznak erre a tartalomra. Ezt senki nem kényszerítette. Az ipar megépítette a vezetéket, betáplálta, és panaszkodott, ami a másik végén jött ki. Nem ellenséges mérgezés. Csak az ipar szennyezi a saját vízellátását, majd tanácsadókat fogad fel annak tesztelésére.

A szint, ami számít

Az Oumi-tanulmány a mesterséges intelligencia áttekintéséről szól, amely ingyenes. A Google AI Overviews a jelentések szerint 2025 közepére több mint kétmilliárd havi aktív felhasználót ért el. A ChatGPT-nek körülbelül 900 millió heti aktív felhasználója van, ebből nagyjából 50 millió fizet. Ez azt jelenti, hogy az OpenAI termékével interakcióba lépő emberek körülbelül 94%-a az ingyenes szinten van.

A fizetett szintek jobbak. Az OpenAI saját, Lily cikkében idézett állításai szerint a GPT-5.4 33%-kal kisebb valószínűséggel állít fel hamis egyéni állításokat, mint a GPT-5.2. A szabadszintű GPT-5.3 is továbbfejlesztett elődjéhez képest (26,8%-kal kevesebb hallucináció webes kereséssel, 19,7%-kal kevesebb anélkül), de még így is lényegesen kevésbé megbízható, mint a fizetőfalas verzió. A Gemini 3, amely pontosabbá tette az AI áttekintéseket a felületi teszteken, is rontotta a megalapozatlan árfolyamot. Jobb válasz, gyengébb idézet.

Úgy tűnik, senki sem bánja. A termék megbízható változata fizetőfalas. A bolygó nagy részének elérhető verziója – beleértve a Google Keresés tetején található verziót is – 20 percnyi munkával manipulálható egy személyes webhelyen. Az intelligencia a marketing kategória. Amit valójában kétmilliárd felhasználó kap, az magabiztos összefoglalása annak, amit a bejáró véletlenül talált.

Grokipedia, mint a terminál állam

A visszakereső réteg balesetei egy dolog. A Grokipedia az a verzió, ahol a baleset már nem hasznos szó.

Elon Musk xAI-ja 2025. október 27-én indította el a Grokipediát, 885 279 cikkel, amelyeket Grok generált vagy írt át. Némelyikük kikerült a Wikipédia nagykereskedelméből, alul egy felelősségkizárással, amely elismeri a CC-BY-SA licencet; a Wikipédia által fenntartott licenc pontosan azért, mert emberi szerkesztők közössége írja és ellenőrzi a tartalmat. Másokat a semmiből átírtak. A PolitiFact forrásként talált Grokipedia idézeteket, köztük az Instagram tekercseit, amelyeket a Wikipédia saját szabályzata szerint „általában elfogadhatatlannak” minősít. A Grokipedia Feist kanadai énekesről szóló bejegyzése szerint apja 2021 májusában halt meg, hivatkozva a Vice 2017-es kanadai indie rockról szóló cikkére, amely nem tett említést a halálról. És az apja még élt a cikk írásakor. A fizikai Nobel-díjhoz fűzött egy idézetlen mondat, amely azt állítja, hogy hagyományosan a fizika az első díj az ünnepségen, ami nem igaz.

Musk szerint a cél az, hogy „kutassák az internet többi részét, bármit is, ami nyilvánosan elérhető, és kijavítsák a Wikipédia-cikket”. A az internet többi része mostantól tartalmazza a szintetikus tartalmat, amelyet minden ráirányított AI tartalomfolyamat termel. Egy mesterséges intelligencia rendszer, amely olvassa a nyílt webet, átírja a Wikipédiát a találtak alapján, és az eredményt referenciamunkaként mutatja be, a visszakeresési-szennyeződési probléma a visszacsatolási hurok explicitté tételével és termékként szállítva.

2026. február közepére a Grokipedia elvesztette Google-láthatóságának nagy részét. A Wikipédia megelőzi a Grokipédiát magával a Grokipédiával kapcsolatos keresések tekintetében.

„Ez az ember által létrehozott tudás az, amire a mesterséges intelligencia vállalatok támaszkodnak a tartalom létrehozása során; még a Grokipédiának is szüksége van a Wikipédiára, hogy létezzen.” – A Wikimédia Alapítvány

A szintetikus enciklopédiát az emberi enciklopédia támogatja. Amikor a támogatás megszűnik, a tőle függő dolog értelmetlenné válik.

A Wikipédia nem áll kritikán felül. Szerkesztési háborúi, ideológiai kapuőrzései és rendszerszintű hiányosságai a cikkek alakításában jól dokumentáltak és valósak. A hibás emberi szerkesztési folyamatra azonban nem az a válasz, hogy az embereket teljesen eltávolítjuk, és az eredményt javulásnak nevezzük. Korábban már írtam arról az elszámoltathatósági vákuumról, amely akkor nyílik meg, ha az emberi ítélőképességet API-hívásokra cseréljük. A Wikipédia problémái a rendetlen, vitatott, elszámoltatható rendszer problémái. A Grokipedia problémái egy olyan rendszer problémái, ahol nincs felelősség.

Az idézési réteg elválik a szerzőségtől

Nemrég írtam arról, hogy a Reddit eladta az „Authentic Human Conversation™”-t AI-cégeknek, miközben a platform saját moderátorai arról számoltak be, hogy már nem tudják megmondani, mely megjegyzések emberiek. Az Oumi tanulmány szerint az AI Overviews által hivatkozott 5380 forrás közül a Facebook és a Reddit a második és a negyedik leggyakoribb. A világ leggyakrabban használt válaszmotorjának idézési rétege lényegében két olyan platformra épül, amelyek nem tudják ellenőrizni saját tartalmaik emberi eredetét.

Az emberi alkotók kivonulnak a nyílt hálóból, mert a forgalmi alku összeomlott. A válaszmotorok olyan tartalmakra hivatkoznak, amelyek szerzője nem ellenőrizhető, vagy amely kezdetben soha nem volt emberi. Az idézet még mindig ott van. Az idézett dolog nem az, ami korábban volt.

Az ouroboros keretezés helyes volt. Az idővonal nem volt. A visszanyerési összeomlás nem várja meg a következő edzési futást. Szüksége van egy indexelhető URL-re és egy olyan visszakereső rendszerre, amely hajlandó megbízni benne.

A rendszerek hajlandóak. És az esetek több mint felében helyes választ kapnak, és nem tudnak olyan forrásra mutatni, amely alátámasztja az imént elmondottakat.

Ez a bejegyzés eredetileg a The Inference oldalon jelent meg.