Az LLM-útmutató nem a SEO útmutatás módját adja át

Peter

Körülbelül két évtizeden át a SEO tudományág egy csendes feltételezés alapján működött, amely az egyik legértékesebb tulajdonságának bizonyult. Útmutató az egyik keresőmotorból. Ha a Google szerint a webhelytérképek számítanak, a Bing szerint a webhelytérképek számítanak. Ha Bing szerint a strukturált adatok valódi erőfeszítést érdemelnek, a Google ugyanezt mondta. A gyakorlók a Google-ra optimalizáltak, ésszerű bizalommal, hogy a munka át fog terjedni a többi motoron is, és legtöbbször így is történt. Ez a hordozhatóság nem volt szerencsés. Ez egy szerkezetileg nagy átfedési réteg eredménye volt, amelyet a nagy keresőmotorok húsz éven keresztül tégláról téglára közösen építettek fel.

Ez a világ nem létezik az LLM-országban. A főbb szolgáltatók különböző korpuszokon oktatnak, különböző bejárókat futtatnak különböző házirendek szerint, különböző lekérdezéseket irányítanak különböző visszakeresési rendszereken keresztül, és különböző igazítási folyamatokat alkalmaznak, amelyek úgy alakítják a végső választ, hogy a felfelé irányuló jelek nem tudják előre jelezni. Bármely szolgáltatótól származó útmutatás, beleértve a Google saját Gemini termékeivel kapcsolatos útmutatásait is, egy adatpont. Azok a szakemberek, akik a keresőoptimalizálási szokást, vagyis azt a szokást, hogy az egyik motor útmutatásait nagyjából a teljes térképként kezelik, magabiztosan optimalizálnak egy platformra, és hiányoznak a többiről.

Oldalsáv: Miközben ezt a darabot véglegesítettem, a Google új útmutatást tett közzé a generatív AI-funkciók optimalizálásához. Keretezésük egyértelmű: a Google Search szemszögéből az AI-keresésre való optimalizálás továbbra is SEO. Ez a keretezés pontos a Google Keresés számára. Nem terjed ki a ChatGPT-re, Claude-ra, Perplexityre vagy bármely más LLM-re, és ez a cikk pontosan erről a csapdáról szól.

A megosztott szabványok, amelyek a SEO útmutatót hordozhatóvá tették

A hordozható útmutatás korszaka a tényleges együttműködésre épült, nem a véletlenre. A Sitemaps protokoll 2006 novemberében a Google, a Yahoo és a Microsoft közös tulajdonába került, amikor a három motor hivatalosan megállapodott egy közös protokoll 0.90-es verziójának támogatásáról, amely a Google korábbi, 2005. júniusi 0.84-es webhelytérképére épít. Öt évvel később, 2011. június 2-án ugyanaz a három motor hozta létre a közös sémát, miután rövid időn belül elindította a Sémát. szókincs a strukturált adatjelöléshez. Ez volt a bejelentés, amely az SMX Advanced színpadán hangzott el. Abban az időben a Bing csapatában voltam, és ami akkor megdöbbentett, az még most is számít. A motorok versenytársak voltak, de úgy döntöttek, hogy a közös szókincs mindannyiukat szolgálja. A webmesterek egy szabálykészlettel rendelkeznek. A web tisztább adatokat kapott. A motorok jobb jeleket kaptak. Mindenki nyert.

A minta megismétlődött a robots.txt fájlban, az 1994-es egyezményben, amely 2022-ben az IETF-en RFC 9309 lett, formalizálva azt, amit már minden komoly bejáró tisztelt. És ez megismétlődött, a közelmúltban az IndexNow-val, a Microsoft Bing és a Yandex protokolljával, amelyet 2021 októberében indítottak el. Az IndexNow-ot mostantól a Bing, a Yandex, a Naver, a Seznam és a Yep támogatja. A Google 2021 óta teszteli a protokollt, de nem fogadta el.

Pontosan ez az átfedési réteg az oka annak, hogy a Google útmutatásait biztonságosan követheti, még akkor is, ha törődik a Bing-forgalommal. A motorok által használt jelek nem voltak azonosak, de az általuk elfogadott bemenetek, a protokollok, amelyeket tiszteletben tartottak, és a hirdetett szabványok igen. Az optimalizálásnak megosztott szubsztrátuma volt.

Ahol az LLM-halmok valójában eltérnek

Az LLM-környezetnek nincs hasonló méretű megosztott hordozója. A különbségek nem kozmetikai jellegűek, és nem átmenetiek. Bele vannak építve a rendszerek felépítésébe.

Kezdje az edzésadatokkal. Az OpenAI nyilvánosságra hozott licencszerződéseket írt alá a News Corp-pal öt év alatt legfeljebb 250 millió dollár értékben, az Axel Springerrel körülbelül évi 13 millió dollárral, a Reddittel 70 millió dollárra becsült évente, valamint a Financial Times-szal, a Condé Nast-tal, a Hearst-tel, a Vox Media-val, a The Atlantic-tal, az Associated Press-rel, a Le Monde-val és másokkal. A Google-nak van saját Reddit-ügylete, amely a becslések szerint évi 60 millió dollár, és valós idejű adat API-hozzáférést biztosít. Az Anthropic nem tett közzé nyilvánosan egyenértékű kiadói licencszerződéseket, és ez a nem titkolt állapot maga is a gyakorló szakemberekkel szembesül. A korpuszok, amelyek ezeket a modelleket táplálták, és amelyek folyamatosan frissítik őket, nem ugyanazok a dokumentumok. A gyakorló szakemberek nem tudhatják, hogy az adott szolgáltató mire fizetett és mire nem.

A lánctalpas infrastruktúra ezután eltér egymástól. Az OpenAI három különálló robotot futtat: a GPTBot a képzéshez, az OAI-SearchBot a keresési indexeléshez és a ChatGPT-User a felhasználó által kezdeményezett visszakereséshez. Az Anthropic három sajátot futtat: a ClaudeBot a képzéshez, a Claude-SearchBot a kereséshez és a Claude-User a felhasználó által kezdeményezett visszakereséshez. A Perplexity futtatja a PerplexityBotot és a Perplexity-User-t. A Google 2023 szeptemberében mutatta be a Google-Extended szolgáltatást, mint felhasználói ügynököt, amely szabályozza, hogy a Google felhasználhatja-e egy webhely tartalmát a Gemini képzésére, teljesen elkülönülve a hagyományos keresési indexelést kezelő Googlebottól. Nincs egyetlen AI felhasználói ügynök. Minden szolgáltatónak külön szabályra van szüksége, és a szabályok nem értelmezhetők egyértelműen a szolgáltatók között, mivel a robotok nem végeznek egyenértékű feladatokat egyenértékű módon.

A visszakeresési architektúrák szerkezetileg eltérnek egymástól. A ChatGPT korábban a Bing indexét használta elsődleges webes keresési forrásként, és úgy tűnik, hogy továbbra is ez a kapcsolat az elsődleges, bár az OpenAI továbbra is további infrastruktúrát épít ki mellette. A Perplexity egy Vespa-alapú folyamatra építette visszakereső rendszerét, amely a dokumentumokat és az aldokumentum-darabokat első osztályú visszakereshető egységként kezeli. A Google Gemini a Google saját indexét, valamint a Knowledge Graph alapozását használja. Claude a Brave Search-ot használja visszakereső partnerként. Ugyanaz a lekérdezés, négy különböző visszakereső rendszer, négy különböző nézet arról, hogy mely források léteznek, és melyek azok a források, amelyeket érdemes felkeresni.

Ezután jön az igazítási réteg, ahol a SEO-nak egyáltalán nem volt megfelelője. Miután egy modellt betanítottak a korpuszra, a szolgáltatók utóképzést folytatnak, hogy alakítsák a modell tényleges viselkedését: hangnem, elutasítási minták, formátum, biztonsági testtartás, mi számít jó válasznak. Az OpenAI elsődleges megközelítése az RLHF, vagyis az emberi visszajelzésből történő tanulás megerősítése volt, ahol az emberi értékelők pontozzák a modell kimeneteit, a modell pedig megtanul magasan értékelt válaszokat produkálni. Az Anthropic által kifejlesztett alkotmányos mesterséges intelligencia, amely modelleket képez ki, hogy bírálják és felülvizsgálják saját eredményeiket egy írott alapelv szerint. Ezek a módszerek kimutathatóan eltérő viselkedést eredményeznek a végtermékekben. Ugyanaz a visszakeresett tartalom két modellbe táplálva, két módszertan szerint, két lényegesen eltérő választ adhat ugyanarról a márkáról.

Ha az egyik szolgáltató útmutatása kimutathatóan nem portolódik át

A portolás nélküli útmutatás legvilágosabb példája az llms.txt. Jeremy Howard, az Answer.AI munkatársa, 2024 szeptemberében javasolta a fájlt egy leértékelési jegyzékként, amelyet egy webhely gyökeréhez kell elhelyezni, amely elvezeti az LLM-eket a legfontosabb tartalomhoz. A javaslatot az egész SEO közösség felkapta. Yoas generátort épített. Az ügynökségek hozzáadták az llms.txt létrehozását szolgáltatási katalógusukhoz. A konferencia előadói elengedhetetlennek nyilvánították.

2026 közepéig egyetlen jelentős LLM-szolgáltató sem erősítette meg, hogy felhasználja a fájlt. Nem OpenAI. Nem antropikus. Nem a Google. A több százezer tartományra kiterjedő szervernapló-elemzések azt mutatják, hogy a fő AI-robotok egyáltalán nem kérik rutinszerűen az /llms.txt fájlt. John Mueller, a Google nyilvánosan összehasonlította az elavult meta kulcsszavakkal. Gary Illyes a Search Central Live 2025 júliusában megerősítette, hogy a Google nem támogatja az llms.txt fájlt, és nem is tervezi ezt.

Erről már máshol írtam, ezért itt nem ismétlem meg a technikai részleteket. Ami ennél az érvnél számít, az a strukturális lecke. A Schema.org sikeres volt, mert három motor együtt építette, majd együtt kényszerítette ki. Az Llms.txt fájlt egy kutató javasolta, a szerszámgyártók átvették, és figyelmen kívül hagyták a platformok, amelyeket ki kellett volna szolgálnia. A SEO-nak hordozható útmutatást nyújtó megosztott szabványok modellje nem azonos léptékben érhető el az LLM szakemberek számára, mivel a platformok nem együtt építik fel a szabványokat. Saját csővezetékeket építenek.

Az Ikrek Inverziója

A legtisztább szemléltetése annak, hogy az útmutatás hordozhatósága mennyit romlott, egy vállalaton belül található. A Google közzéteszi saját SEO-dokumentációját a Search Centralban, amely az iparág két évtizede követi a kanonikus iránymutatást. Ezek a dokumentumok a hagyományos rangsorolási jeleket, az EEAT-t, a tartalom minőségét, a technikai hozzáférhetőséget és a strukturált adatokat hangsúlyozzák. Ez az útmutatás továbbra is hasznos magának a Google Keresésnek.

A Google gyártja a Geminit is, az AI áttekintéseket és a Google különálló AI mód felületét működtető modellt. És úgy tűnik, hogy ezeknek a felületeknek az idézési viselkedése nem követi nyomon azt az útmutatást, amelyet ugyanaz a vállalat tesz közzé a saját keresési eredményeihez.

2024 végén az AI-áttekintésekben hivatkozott oldalak nagyjából háromnegyede ugyanerre a lekérdezésre a Google top 12-je között is helyet kapott. 2026 elejére, miután a Google januárban Gemini 3-ra frissítette az AI-áttekintéseket, az Ahrefs 4 millió mesterségesintelligencia-áttekintő URL-t elemzett, és azt találta, hogy az idézett oldalak mindössze 38%-a szerepelt ugyanarra a lekérdezésre a top 10-ben. Egy különálló BrightEdge elemzés az átfedést 17%-hoz közelítette. Az SE Ranking frissítés utáni munkája azt találta, hogy a Gemini 3 a korábban hivatkozott tartományok körülbelül 42%-át cserélte ki a korábbi modellverziókban, és válaszonként 32%-kal több forrást generál.

A különbség tovább nő, ha megnézzük a Google AI módját, amely egy külön beszélgetési felület, amely ugyanazon a Gemini családon fut. A Semrush adatai azt mutatják, hogy az AI mód és az AI áttekintések az esetek 86%-ában jutnak szemantikailag hasonló következtetésekre, de csak az esetek 13,7%-ában hivatkoznak ugyanazokra az URL-ekre. Az AI módra vonatkozó idézetek mindössze 14%-a szerepel a Google hagyományos top 10-ében.

Egyelőre úgy tűnik, hogy a kanonikus viszony megváltozott. A Google közzétett SEO útmutatása továbbra is a legtisztább út a Google Keresésben való rangsoroláshoz. Ez a rangsor azonban már nem megbízható proxy arra vonatkozóan, hogy a Google saját mesterséges intelligencia felületei hivatkoznak rá. Ugyanaz az útmutatás, ugyanaz a tartalom, ugyanaz a domain három, egymástól jelentősen eltérő eredményt eredményezhet a Google Keresésben, az AI áttekintésekben és az AI-módban, még akkor is, ha mindhárom ugyanazon a cégen belül él. Úgy tűnik, hogy a keresőmotor útmutatásainak követésére és a motor többi felületének következetes viselkedésében való bizalomra vonatkozó régi játékkönyv nem nyújtja ugyanazt a hozamot, mint korábban.

Mik még mindig portok, és miért kisebb, mint amilyennek látszik

Egy univerzális réteg megmarad. A feltérképező robotok hozzáférhetősége továbbra is minden szolgáltatónál számít. Az elsődleges forrásból származó tényszerű tartalom továbbra is több hivatkozást nyer, mint az összesítő újramondás. A tiszta visszakereshető szerkezet továbbra is segít minden rendszernek megérteni, miről szól egy oldal. A nagy tekintélyű források jelenléte, amelyeket az összes nagy LLM aránytalanul hivatkozik, a Wikipédia, a YouTube, a Reddit, a főbb hírügynökségek, továbbra is erőtömeg-szorzóként funkcionál a platformok között. Az ezeken a forrásokon való láthatóság megszerzése lehetőséget ad a tartalomnak arra, hogy minden olyan LLM-ben megjelenjen, amely a forrásokból merít.

De az univerzális réteg sokkal kisebb, mint a SEO-korszakban volt. A Qwairy a ChatGPT, a Perplexity, a Google AI Mode és a Claude 118 000 AI-válaszát elemző elemzése szerint az idézett domaineknek csak 11%-a jelent meg több platformon. A másik 89% platformfüggő volt. Az a márka, amely megnyeri a Perplexity idézeteit, nagyrészt láthatatlan Claude-on. Előfordulhat, hogy a ChatGPT rendszeres referenciaként szereplő márka egyáltalán nem jelenik meg az AI áttekintésekben. Ugyanaz a tartalom lehet a helyes válasz egy rendszerre, és a rossz válasz a mellette lévő rendszerre.

Mit jelent ez a munka szempontjából

A gyakorlati következmény az, hogy nem adunk fel minden reményt. Ez az, hogy a szakembereknek fel kell hagyniuk azzal, hogy egyetlen LLM-szolgáltató útmutatásait univerzális térképként kezeljék, és el kell kezdeniük úgy kezelni, mint egy bemenetet a több közül. Olvassa el, mit tesz közzé minden nagyobb szolgáltató a saját rendszereiről. Tesztelje láthatóságát különböző platformokon, ne csak azon a platformon, amelyet a legtöbbször használ. Az eltérést kezelje alapértelmezettként, az átfedést pedig kivételként, ne pedig fordítva.

A SEO nem így működött, és a különbség számít. A régi reflex az volt, hogy optimalizáljunk a Google-ra, és bízunk a hordozhatóságban. Az új valóság az, hogy ha követi egy LLM útmutatásait, még a Google Ikrekről szóló útmutatásait is, optimalizálva lesz a táj egy szeletére, és potenciálisan vak lesz a többi számára. A diszciplínát olyan platform-specifikus munkákra építik át, amelyek nem léteztek a SEO-korszakban, és azok a szakemberek, akik felismerik, hogy először, a következő két évet azzal töltik, hogy felállítsák azokat a szabványokat, amelyeket mindenki követ.

Az átfedés csökkent. Most több munkád van, mint valaha.

Ha gondolatai vannak arról, hogy saját munkájában hol a legélesebb a szolgáltatók közötti eltérés, forduljon közvetlenül. Őszintén szeretném hallani, hogy mi jelenik meg az adatok között.


Ez a bejegyzés eredetileg a Duane Forrester Decodes oldalon jelent meg.


A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.