Az LLM-útmutató nem a SEO útmutatás módját adja át

Körülbelül két évtizeden át a SEO tudományág egy csendes feltételezés alapján működött, amely az egyik legértékesebb tulajdonságának bizonyult. Útmutató az egyik keresőmotorból. Ha a Google szerint a webhelytérképek számítanak, a Bing szerint a webhelytérképek számítanak. Ha Bing szerint a strukturált adatok valódi erőfeszítést érdemelnek, a Google ugyanezt mondta. A gyakorlók a Google-ra optimalizáltak, ésszerű bizalommal, hogy a munka át fog terjedni a többi motoron is, és legtöbbször így is történt. Ez a hordozhatóság nem volt szerencsés. Ez egy szerkezetileg nagy átfedési réteg eredménye volt, amelyet a nagy keresőmotorok húsz éven keresztül tégláról téglára közösen építettek fel.

Ez a világ nem létezik az LLM-országban. A főbb szolgáltatók különböző korpuszokon oktatnak, különböző bejárókat futtatnak különböző házirendek szerint, különböző lekérdezéseket irányítanak különböző visszakeresési rendszereken keresztül, és különböző igazítási folyamatokat alkalmaznak, amelyek úgy alakítják a végső választ, hogy a felfelé irányuló jelek nem tudják előre jelezni. Bármely szolgáltatótól származó útmutatás, beleértve a Google saját Gemini termékeivel kapcsolatos útmutatásait is, egy adatpont. Azok a szakemberek, akik a keresőoptimalizálási szokást, vagyis azt a szokást, hogy az egyik motor útmutatásait nagyjából a teljes térképként kezelik, magabiztosan optimalizálnak egy platformra, és hiányoznak a többiről.

Oldalsáv: Miközben ezt a darabot véglegesítettem, a Google új útmutatást tett közzé a generatív AI-funkciók optimalizálásához. Keretezésük egyértelmű: a Google Search szemszögéből az AI-keresésre való optimalizálás továbbra is SEO. Ez a keretezés pontos a Google Keresés számára. Nem terjed ki a ChatGPT-re, Claude-ra, Perplexityre vagy bármely más LLM-re, és ez a cikk pontosan erről a csapdáról szól.

A megosztott szabványok, amelyek a SEO útmutatót hordozhatóvá tették

A hordozható útmutatás korszaka a tényleges együttműködésre épült, nem a véletlenre. A Sitemaps protokoll 2006 novemberében a Google, a Yahoo és a Microsoft közös tulajdonába került, amikor a három motor hivatalosan megállapodott egy közös protokoll 0.90-es verziójának támogatásáról, amely a Google korábbi, 2005. júniusi 0.84-es webhelytérképére épít. Öt évvel később, 2011. június 2-án ugyanaz a három motor hozta létre a közös sémát, miután rövid időn belül elindította a Sémát. szókincs a strukturált adatjelöléshez. Ez volt a bejelentés, amely az SMX Advanced színpadán hangzott el. Abban az időben a Bing csapatában voltam, és ami akkor megdöbbentett, az még most is számít. A motorok versenytársak voltak, de úgy döntöttek, hogy a közös szókincs mindannyiukat szolgálja. A webmesterek egy szabálykészlettel rendelkeznek. A web tisztább adatokat kapott. A motorok jobb jeleket kaptak. Mindenki nyert.

A minta megismétlődött a robots.txt fájlban, az 1994-es egyezményben, amely 2022-ben az IETF-en RFC 9309 lett, formalizálva azt, amit már minden komoly bejáró tisztelt. És ez megismétlődött, a közelmúltban az IndexNow-val, a Microsoft Bing és a Yandex protokolljával, amelyet 2021 októberében indítottak el. Az IndexNow-ot mostantól a Bing, a Yandex, a Naver, a Seznam és a Yep támogatja. A Google 2021 óta teszteli a protokollt, de nem fogadta el.

Pontosan ez az átfedési réteg az oka annak, hogy a Google útmutatásait biztonságosan követheti, még akkor is, ha törődik a Bing-forgalommal. A motorok által használt jelek nem voltak azonosak, de az általuk elfogadott bemenetek, a protokollok, amelyeket tiszteletben tartottak, és a hirdetett szabványok igen. Az optimalizálásnak megosztott szubsztrátuma volt.

Ahol az LLM-halmok valójában eltérnek

Az LLM-környezetnek nincs hasonló méretű megosztott hordozója. A különbségek nem kozmetikai jellegűek, és nem átmenetiek. Bele vannak építve a rendszerek felépítésébe.

Kezdje az edzésadatokkal. Az OpenAI nyilvánosságra hozott licencszerződéseket írt alá a News Corp-pal öt év alatt legfeljebb 250 millió dollár értékben, az Axel Springerrel körülbelül évi 13 millió dollárral, a Reddittel 70 millió dollárra becsült évente, valamint a Financial Times-szal, a Condé Nast-tal, a Hearst-tel, a Vox Media-val, a The Atlantic-tal, az Associated Press-rel, a Le Monde-val és másokkal. A Google-nak van saját Reddit-ügylete, amely a becslések szerint évi 60 millió dollár, és valós idejű adat API-hozzáférést biztosít. Az Anthropic nem tett közzé nyilvánosan egyenértékű kiadói licencszerződéseket, és ez a nem titkolt állapot maga is a gyakorló szakemberekkel szembesül. A korpuszok, amelyek ezeket a modelleket táplálták, és amelyek folyamatosan frissítik őket, nem ugyanazok a dokumentumok. A gyakorló szakemberek nem tudhatják, hogy az adott szolgáltató mire fizetett és mire nem.

A lánctalpas infrastruktúra ezután eltér egymástól. Az OpenAI három különálló robotot futtat: a GPTBot a képzéshez, az OAI-SearchBot a keresési indexeléshez és a ChatGPT-User a felhasználó által kezdeményezett visszakereséshez. Az Anthropic három sajátot futtat: a ClaudeBot a képzéshez, a Claude-SearchBot a kereséshez és a Claude-User a felhasználó által kezdeményezett visszakereséshez. A Perplexity futtatja a PerplexityBotot és a Perplexity-User-t. A Google 2023 szeptemberében mutatta be a Google-Extended szolgáltatást, mint felhasználói ügynököt, amely szabályozza, hogy a Google felhasználhatja-e egy webhely tartalmát a Gemini képzésére, teljesen elkülönülve a hagyományos keresési indexelést kezelő Googlebottól. Nincs egyetlen AI felhasználói ügynök. Minden szolgáltatónak külön szabályra van szüksége, és a szabályok nem értelmezhetők egyértelműen a szolgáltatók között, mivel a robotok nem végeznek egyenértékű feladatokat egyenértékű módon.

A visszakeresési architektúrák szerkezetileg eltérnek egymástól. A ChatGPT korábban a Bing indexét használta elsődleges webes keresési forrásként, és úgy tűnik, hogy továbbra is ez a kapcsolat az elsődleges, bár az OpenAI továbbra is további infrastruktúrát épít ki mellette. A Perplexity egy Vespa-alapú folyamatra építette visszakereső rendszerét, amely a dokumentumokat és az aldokumentum-darabokat első osztályú visszakereshető egységként kezeli. A Google Gemini a Google saját indexét, valamint a Knowledge Graph alapozását használja. Claude a Brave Search-ot használja visszakereső partnerként. Ugyanaz a lekérdezés, négy különböző visszakereső rendszer, négy különböző nézet arról, hogy mely források léteznek, és melyek azok a források, amelyeket érdemes felkeresni.

Ezután jön az igazítási réteg, ahol a SEO-nak egyáltalán nem volt megfelelője. Miután egy modellt betanítottak a korpuszra, a szolgáltatók utóképzést folytatnak, hogy alakítsák a modell tényleges viselkedését: hangnem, elutasítási minták, formátum, biztonsági testtartás, mi számít jó válasznak. Az OpenAI elsődleges megközelítése az RLHF, vagyis az emberi visszajelzésből történő tanulás megerősítése volt, ahol az emberi értékelők pontozzák a modell kimeneteit, a modell pedig megtanul magasan értékelt válaszokat produkálni. Az Anthropic által kifejlesztett alkotmányos mesterséges intelligencia, amely modelleket képez ki, hogy bírálják és felülvizsgálják saját eredményeiket egy írott alapelv szerint. Ezek a módszerek kimutathatóan eltérő viselkedést eredményeznek a végtermékekben. Ugyanaz a visszakeresett tartalom két modellbe táplálva, két módszertan szerint, két lényegesen eltérő választ adhat ugyanarról a márkáról.

Ha az egyik szolgáltató útmutatása kimutathatóan nem portolódik át

A portolás nélküli útmutatás legvilágosabb példája az llms.txt. Jeremy Howard, az Answer.AI munkatársa, 2024 szeptemberében javasolta a fájlt egy leértékelési jegyzékként, amelyet egy webhely gyökeréhez kell elhelyezni, amely elvezeti az LLM-eket a legfontosabb tartalomhoz. A javaslatot az egész SEO közösség felkapta. Yoas generátort épített. Az ügynökségek hozzáadták az llms.txt létrehozását szolgáltatási katalógusukhoz. A konferencia előadói elengedhetetlennek nyilvánították.

2026 közepéig egyetlen jelentős LLM-szolgáltató sem erősítette meg, hogy felhasználja a fájlt. Nem OpenAI. Nem antropikus. Nem a Google. A több százezer tartományra kiterjedő szervernapló-elemzések azt mutatják, hogy a fő AI-robotok egyáltalán nem kérik rutinszerűen az /llms.txt fájlt. John Mueller, a Google nyilvánosan összehasonlította az elavult meta kulcsszavakkal. Gary Illyes a Search Central Live 2025 júliusában megerősítette, hogy a Google nem támogatja az llms.txt fájlt, és nem is tervezi ezt.

Erről már máshol írtam, ezért itt nem ismétlem meg a technikai részleteket. Ami ennél az érvnél számít, az a strukturális lecke. A Schema.org sikeres volt, mert három motor együtt építette, majd együtt kényszerítette ki. Az Llms.txt fájlt egy kutató javasolta, a szerszámgyártók átvették, és figyelmen kívül hagyták a platformok, amelyeket ki kellett volna szolgálnia. A SEO-nak hordozható útmutatást nyújtó megosztott szabványok modellje nem azonos léptékben érhető el az LLM szakemberek számára, mivel a platformok nem együtt építik fel a szabványokat. Saját csővezetékeket építenek.

Az Ikrek Inverziója

A legtisztább szemléltetése annak, hogy az útmutatás hordozhatósága mennyit romlott, egy vállalaton belül található. A Google közzéteszi saját SEO-dokumentációját a Search Centralban, amely az iparág két évtizede követi a kanonikus iránymutatást. Ezek a dokumentumok a hagyományos rangsorolási jeleket, az EEAT-t, a tartalom minőségét, a technikai hozzáférhetőséget és a strukturált adatokat hangsúlyozzák. Ez az útmutatás továbbra is hasznos magának a Google Keresésnek.

A Google gyártja a Geminit is, az AI áttekintéseket és a Google különálló AI mód felületét működtető modellt. És úgy tűnik, hogy ezeknek a felületeknek az idézési viselkedése nem követi nyomon azt az útmutatást, amelyet ugyanaz a vállalat tesz közzé a saját keresési eredményeihez.

2024 végén az AI-áttekintésekben hivatkozott oldalak nagyjából háromnegyede ugyanerre a lekérdezésre a Google top 12-je között is helyet kapott. 2026 elejére, miután a Google januárban Gemini 3-ra frissítette az AI-áttekintéseket, az Ahrefs 4 millió mesterségesintelligencia-áttekintő URL-t elemzett, és azt találta, hogy az idézett oldalak mindössze 38%-a szerepelt ugyanarra a lekérdezésre a top 10-ben. Egy különálló BrightEdge elemzés az átfedést 17%-hoz közelítette. Az SE Ranking frissítés utáni munkája azt találta, hogy a Gemini 3 a korábban hivatkozott tartományok körülbelül 42%-át cserélte ki a korábbi modellverziókban, és válaszonként 32%-kal több forrást generál.

A különbség tovább nő, ha megnézzük a Google AI módját, amely egy külön beszélgetési felület, amely ugyanazon a Gemini családon fut. A Semrush adatai azt mutatják, hogy az AI mód és az AI áttekintések az esetek 86%-ában jutnak szemantikailag hasonló következtetésekre, de csak az esetek 13,7%-ában hivatkoznak ugyanazokra az URL-ekre. Az AI módra vonatkozó idézetek mindössze 14%-a szerepel a Google hagyományos top 10-ében.

Egyelőre úgy tűnik, hogy a kanonikus viszony megváltozott. A Google közzétett SEO útmutatása továbbra is a legtisztább út a Google Keresésben való rangsoroláshoz. Ez a rangsor azonban már nem megbízható proxy arra vonatkozóan, hogy a Google saját mesterséges intelligencia felületei hivatkoznak rá. Ugyanaz az útmutatás, ugyanaz a tartalom, ugyanaz a domain három, egymástól jelentősen eltérő eredményt eredményezhet a Google Keresésben, az AI áttekintésekben és az AI-módban, még akkor is, ha mindhárom ugyanazon a cégen belül él. Úgy tűnik, hogy a keresőmotor útmutatásainak követésére és a motor többi felületének következetes viselkedésében való bizalomra vonatkozó régi játékkönyv nem nyújtja ugyanazt a hozamot, mint korábban.

Mik még mindig portok, és miért kisebb, mint amilyennek látszik

Egy univerzális réteg megmarad. A feltérképező robotok hozzáférhetősége továbbra is minden szolgáltatónál számít. Az elsődleges forrásból származó tényszerű tartalom továbbra is több hivatkozást nyer, mint az összesítő újramondás. A tiszta visszakereshető szerkezet továbbra is segít minden rendszernek megérteni, miről szól egy oldal. A nagy tekintélyű források jelenléte, amelyeket az összes nagy LLM aránytalanul hivatkozik, a Wikipédia, a YouTube, a Reddit, a főbb hírügynökségek, továbbra is erőtömeg-szorzóként funkcionál a platformok között. Az ezeken a forrásokon való láthatóság megszerzése lehetőséget ad a tartalomnak arra, hogy minden olyan LLM-ben megjelenjen, amely a forrásokból merít.

De az univerzális réteg sokkal kisebb, mint a SEO-korszakban volt. A Qwairy a ChatGPT, a Perplexity, a Google AI Mode és a Claude 118 000 AI-válaszát elemző elemzése szerint az idézett domaineknek csak 11%-a jelent meg több platformon. A másik 89% platformfüggő volt. Az a márka, amely megnyeri a Perplexity idézeteit, nagyrészt láthatatlan Claude-on. Előfordulhat, hogy a ChatGPT rendszeres referenciaként szereplő márka egyáltalán nem jelenik meg az AI áttekintésekben. Ugyanaz a tartalom lehet a helyes válasz egy rendszerre, és a rossz válasz a mellette lévő rendszerre.

Mit jelent ez a munka szempontjából

A gyakorlati következmény az, hogy nem adunk fel minden reményt. Ez az, hogy a szakembereknek fel kell hagyniuk azzal, hogy egyetlen LLM-szolgáltató útmutatásait univerzális térképként kezeljék, és el kell kezdeniük úgy kezelni, mint egy bemenetet a több közül. Olvassa el, mit tesz közzé minden nagyobb szolgáltató a saját rendszereiről. Tesztelje láthatóságát különböző platformokon, ne csak azon a platformon, amelyet a legtöbbször használ. Az eltérést kezelje alapértelmezettként, az átfedést pedig kivételként, ne pedig fordítva.

A SEO nem így működött, és a különbség számít. A régi reflex az volt, hogy optimalizáljunk a Google-ra, és bízunk a hordozhatóságban. Az új valóság az, hogy ha követi egy LLM útmutatásait, még a Google Ikrekről szóló útmutatásait is, optimalizálva lesz a táj egy szeletére, és potenciálisan vak lesz a többi számára. A diszciplínát olyan platform-specifikus munkákra építik át, amelyek nem léteztek a SEO-korszakban, és azok a szakemberek, akik felismerik, hogy először, a következő két évet azzal töltik, hogy felállítsák azokat a szabványokat, amelyeket mindenki követ.

Az átfedés csökkent. Most több munkád van, mint valaha.

Ha gondolatai vannak arról, hogy saját munkájában hol a legélesebb a szolgáltatók közötti eltérés, forduljon közvetlenül. Őszintén szeretném hallani, hogy mi jelenik meg az adatok között.

Ez a bejegyzés eredetileg a Duane Forrester Decodes oldalon jelent meg.