A LinkedIn egyik bejegyzése megkérdőjelezte azt az elképzelést, hogy a Schema.org strukturált adatok hatással vannak arra, hogy egy nagy nyelvi modell mit eredményez. Nyilvánvalóan vannak olyan keresőoptimalizálók, akik strukturált adatokat javasolnak a mesterséges intelligencia keresőmotorjaiban való jobb helyezés érdekében.
Patrick Stox a következő bejegyzést írta a LinkedIn-en:
„Lemaradtam valamiről? Miért gondolják a keresőoptimalizálók, hogy a sémajelölés hatással lesz az LLM-kimenetre?
Patrick azt mondta, hogy „LLM kimenet” egy SEO-ajánlás keretében, így valószínű, hogy ez a ChatGPT Search és más mesterséges intelligencia keresőmotorokra való hivatkozás. Tehát az AI keresőmotorok strukturált adatokból szerzik be adataikat?
Az LLM-eket webszövegekre, könyvekre, kormányzati nyilvántartásokra, jogi dokumentumokra és egyéb szöveges adatokra (valamint a média egyéb formáira is) képezik, amelyeket aztán összefoglalók és válaszok készítésére használnak fel, de a képzési adatok plagizálása nélkül. Ez azt jelenti, hogy értelmetlen azt gondolni, hogy a webes tartalom optimalizálása azt eredményezi, hogy az LLM maga küld majd hivatkozásokat erre a webhelyre.
Az AI keresőmotorok keresési indexeken (és tudásgrafikonokon) alapulnak a Retrieval Augmented Generation (RAG) révén. Maguk a keresőmotor-indexek feltérképezett adatokból jönnek létre, nem a séma strukturált adatokból.
A Perplexity AI például a PageRank módosított verziójával rangsorolja a webes feltérképezést a keresési indexében. A Google és a Bing feltérképezi a szöveges adatokat, és olyan dolgokat hajt végre, mint például a duplikált tartalmak eltávolítása, a stopszavak eltávolítása és a HTML-ből kinyert szöveg egyéb manipulálása, ráadásul nem minden oldalon találhatók strukturált adatok.
Valójában a Google a rendelkezésre álló Schema.org strukturált adatoknak csak egy töredékét használja fel bizonyos típusú keresési élményekhez és bővített találatokhoz, ami viszont korlátozza a megjelenítők által használt strukturált adatok típusát.
Aztán ott van az is, hogy a Bing és a Google feltérképező robotjai is megjelenítik a HTML-t, azonosítják a fejlécet, láblécet és a fő tartalmat (amelyből rangsorolás céljából kivonják a szöveget). Miért tennék ezt, ha a Schema strukturált adatokra fognak hagyatkozni, igaz?
Az az elképzelés, hogy jó a Schema.org strukturált adatok felhasználása a mesterséges intelligencia keresőmotorban való jobb helyezés érdekében, nem tényeken alapul, csak képzeletbeli spekuláció. Vagy lehet egy „telefonjáték” effektusból, amikor egy ember mond valamit, majd húsz emberrel később valami egészen mássá alakul át.
Jono Alderson például azt javasolta, hogy a strukturált adatok olyan szabványok legyenek, amelyeket a mesterséges intelligencia keresőmotorok használhatnának a web jobb megértéséhez. Nem azt mondta, hogy a mesterséges intelligencia keresőmotorok jelenleg is használják, csak azt javasolta, hogy az AI keresőmotorok fontolják meg ennek elfogadását, és talán húsz keresőoptimalizálással később ez a bejegyzés egy teljes elméletbe került.
Sajnos nagyon sok megalapozatlan ötlet kering a SEO körökben. A minap láttam, hogy egy SEO azt állítja a közösségi médiában, hogy a Google Helyi Kereső nem használ IP-címeket a „közelben” keresési lekérdezésekre. Ennek az ötletnek a teszteléséhez csak annyit kell tennie, hogy bejelentkezik egy VPN-be, kiválasztja az IP-címének földrajzi helyet, és végrehajt egy „közelben” keresési lekérdezést, és látni fogja, hogy a VPN által használt IP-cím befolyásolta a „közelben” ” keresési eredményeket.
Képernyőkép az IP-cím által befolyásolt „Near Me” lekérdezésről
A Google még egy támogatási oldalt is közzétesz, amely azt mondja, hogy IP-címet használnak a keresési eredmények személyre szabására, de vannak olyanok, akik ennek ellenkezőjét hiszik, mert néhány SEO korrelációs vizsgálatot végzett, és amikor megkérdőjelezték, ismét valaki azt hazudja, hogy a Google hazudik.
Hiszel a hazug szemednek?
Schema.Org strukturált adatok és mesterséges intelligencia keresési eredményei
Annak a „SEO”-nak, hogy a megjelenítők Schema.org strukturált adatait használják az LLM-képzési adatokhoz, szintén nincs értelme, mivel a képzési adatok nem szerepelnek az LLM-kimenetben, csak az internetről származó kimenet esetében, amely maga egy keresési indexből származik, amely egy lánctalpastól. Amint azt korábban említettük, a megjelenítők a rendelkezésre álló Schema.org strukturált adatoknak csak egy töredékét használják fel, mivel maga a Google is csak egy töredékét használja fel. Tehát nincs értelme, hogy egy mesterséges intelligencia keresőmotor strukturált adatokra hagyatkozzon a kimenetükben.
Christopher Shin keresőmarketing-szakértő (LinkedIn-profil) megjegyezte:
– Ugyanerre gondolok, miután elolvasta a bejegyzését, Patrick. Jelenleg így értelmezem. Azt hittem, az LLM-ek jellemzően nem a keresőmotorokból generálnak válaszokat, hanem inkább az adatok értelmezésével. Jobbra? De a sémaadat-jelölést a SER(ek) használnák a bővített kivonatok stb. megjelenítésére. Nem? Szerintem a sémák és az LLM-ek legfontosabb árnyalata az, hogy a keresőmotorok sémát használnak a SERP-ekhez, míg az LLM-ek adatértelmezést használnak, amikor arról van szó, hogy a séma hogyan hat az LLM-ekre.”
Az olyan emberek, mint Christopher Shin és Patrick Stox, reményt adnak bennem, hogy a pragmatikus és értelmes SEO még mindig küzd azért, hogy túljusson a zajon, Patrick LinkedIn-bejegyzése ezt bizonyítja.
Pragmatikus SEO
A pragmatikus definíció szerint ésszerű és reális okokból teszünk dolgokat, nem pedig hiányos információkon és sejtéseken alapuló vélemények alapján.
Ha úgy beszélünk, mint aki gyakorlatilag a SEO megszületése óta foglalkozik a SEO-val, az az oka, hogy a keresőoptimalizálók és a kiadók hagyományosan az időt vesztegetik homályosan meghatározott problémákkal, haszontalan tevékenységekre, például az EEAT felületes jelzéseire stb., és így tovább, és így tovább. . Igazán elkeserítő dokumentumokra és hivatalos nyilatkozatokra mutatni, és olyan kijelentésekkel röhögni, mint a „Google hazudik”. Ez a fajta hozzáállás arra készteti az embert, hogy „kiabáljon”.
Kérlek egy kicsit pragmatikusabb SEO-t.