Hogyan tervezzünk URL-struktúrákat mesterséges intelligencia-lekérdezéshez, nem csak rangsoroláshoz

Évekig az URL-struktúra technikai SEO jelölőnégyzet volt. Legyen rövid, használjon kötőjelet, adja meg a kulcsszót, kész.

Bár ez a játékkönyv még mindig működik, egyre hiányosabb. A célközönség egyre nagyobb része fedez fel tartalmat mesterséges intelligencia-asszisztenseken és olyan nagy nyelvi modelleken keresztül, mint a ChatGPT, a Perplexity, a Claude, a Google AI Overviews stb.

Ezek a rendszerek a hagyományos keresőrobotoktól eltérően kérik le és szintetizálják az információkat, és ha az URL-architektúra nem ezt szem előtt tartva épül fel, növeli annak esélyét, hogy nem hivatkoznak rá az LLM-ek.

A keresés új korszakában ki kell terjesztenünk ezeket a SEO alapjait, hogy igazodjanak az AI-botokhoz és az URL-ek feltérképezéséhez.

Miért olvassák az AI-rendszerek másképp az URL-eket?

A keresőmotorok évtizedeket töltöttek a kifinomult feltérképezési és indexelési infrastruktúra fejlesztésével. Követik az átirányításokat, feloldják a kanonikusokat, elemzik a JavaScriptet (néha…), és kontextusra következtethetnek egy oldalból, ha az URL véletlenszerű karakterek sorozata.

A mesterséges intelligencia-visszakereső rendszerek, különösen a visszakeresés-bővített generációs (RAG) folyamatok és a webhez kapcsolódó LLM-ek gyakran eltérően működnek.

A RAG működésének három alapvető része van:

A beviteli prompt vektorbeágyazássá alakul
Ezután a rendszer lekéri a releváns szövegrészeket az indexelt URL-ekből, dokumentumokból és tudásdiagramokból a hagyományos keresési eredményekben, mint például a Google és a Bing.
Egy LLM, például a ChatGPT vagy hasonló feldolgozza ezeket az információkat, és finomított választ generál.

A fejlesztők által épített RAG-rendszer alapvetően az URL-ekből származó adatforrásokat használja a tartalom kinyerésére – feltérképezi az URL-t, a webes tartalmat kereshető „darabokká” alakítja, és numerikus vektorokként tárolja későbbi visszakeresés céljából.

Ez most az URL-kontextus-alapozás birodalmává is fejlődik, amely a Geminire jellemző. Az URL-kontextus-alapozás célja, hogy segítse a Geminit (és feltehetően az AI-áttekintéseket / AI-módot) abban, hogy jobban megértsék és megválaszolják az egyes URL-ek tartalmával és adataival kapcsolatos kérdéseket hagyományos RAG-feldolgozás nélkül.

Itt az a cél, hogy az LLM konkrétan több URL-ről gyűjtse be a közvetlen információkat, elemezzen több jelentést, és egyesítse a több forrásból származó információkat, hogy pontosabb összefoglalókat készítsen. Ennek elméletileg hozzá kell járulnia a mesterséges intelligencia pontosságának javításához és a hallucinációk csökkentéséhez.

Aztán ott van a nullapontos besorolás – egy olyan technika, amely lehetővé teszi a modellek számára, hogy kategorizálják a weboldal célját, anélkül, hogy a feladatspecifikus képzési adatokra lenne szükség.

A címkézett példákra hagyatkozás helyett a modell szemantikai jeleket elemzi, például URL-struktúrákat (sima szöveges karakterláncként kezelve), és előre meghatározott kategóriákra képezi le azokat olyan módszerekkel, mint a koszinusz-hasonlóság vagy a prompt-alapú érvelés.

Ez úgy működik, hogy a modell előre betanított nyelvi tudására támaszkodik, hogy következtessen az oldal valószínű funkciójára, ugyanakkor felismeri a szavakban a különböző mintákat, és olyan kifejezéseket, amelyek jelzik, hogy az oldal milyen típusú tartalmat tartalmaz.

Ez különösen hasznos volt az adathalász linkek és más rosszindulatú hivatkozások azonosításában, pusztán URL-mintáik alapján, de azt is jelzi, hogy az LLM-ek hogyan kezdhetik el a nullapontos besorolást, hogy kizárólag az URL-ekre hagyatkozhassanak a szemantikai relevanciára következtetve.

A semmit sem kommunikáló URL keményebb munkára kényszeríti az LLM modelleket, és kétértelművé teszi a tartalom kategorizálását.

Gyakorlatiasabban, amikor egy mesterséges intelligencia rendszer egy forrásra hivatkozik a válaszában, gyakran az URL-t is megjeleníti a kivonat mellett. Ez az URL láthatóvá válik a valódi felhasználók számára, ugyanúgy, mint a keresési eredményekben, és valódi döntéseket fognak hozni arról, hogy kattintanak-e vagy sem.

A tiszta, leíró út olyan módon építi a bizalmat, mint valami hasonló /p?id-4821 soha nem fog.

Az URL-ek mint szemantikai jelek alapelve

Tekintse az URL-struktúrát másodlagos tartalmi rétegnek – olyan rétegnek, amely a hierarchiát, a témát és a konkrétságot függetlenül kommunikálja az oldal címével, H1-gyel vagy más metaadatokkal.

Olyan URL, mint /resources/seo/url-structure-ai-retrieval/ egyszerre több dolgot mond el egy visszakereső rendszernek: Ez egy erőforrás-központ alatt él, egy SEO kategóriába tartozik, és egy adott altémát fed le részletesen.

Ez egy hasznos jelzés. Feltérképezi, hogy a mesterséges intelligencia rendszerek hogyan próbálják megérteni a tartalom eredetét és relevanciáját, mielőtt a válaszban megjelennének.

Ez különösen fontos:

Hosszú farok és kérdés alapú lekérdezések, ahol az AI-rendszerek pontos egyezéseket keresnek az adott információigényekhez.
Aktuális tekintély, ahol az URL-hierarchia megerősítheti, hogy a domain egy tárgykörrel rendelkezik.
Idézetminőség, ahol a leíró URL növeli annak valószínűségét, hogy egy AI-ügynök hivatkozik az Ön tartalmára egy versenytárs közel azonos oldalára.

Gyakorlati építészeti alapelvek

Számos gyakorlati architektúraelvet érdemes figyelembe venni mind a hagyományos keresés, mind az AI keresés során.

Használjon logikus, sekély hierarchiát

Mély fészkelés (pl. /blog/category/subcategory/year/month/post-title/) zajt kelt, és tartalma több lépésre van a kezdőlaptól. A három szint mély szerkezet szinte mindig elegendő, pl. domain > kategória > adott oldal. Vannak olyan CMS-beállítások, mint például a Shopify, ahol négyre vagy ötre kényszerítik, a témától függően (pl. domain/blog/blog neve/blogbejegyzés címe/), de mindaddig, amíg értelmes kontextust ad hozzá, és nem adminisztratív zűrzavart, szerkezete igazodik az elvhez.

Legyen minden szegmens ember számára olvasható és leíró jellegű

Kerülje a rövidítéseket, a belső szakzsargont vagy az azonosítószámokat a nyilvános URL-ekben. Olyan URL, mint /ai-search-optimization közvetlenül kommunikálja a témát, míg az URL tetszik /aso-v2 semmit sem közöl előzetes tudás nélkül.

Igazítsa az URL-slugokat a tényleges keresési szándékhoz, ne csak a kulcsszóhoz

Nagy különbség van aközött /e-mail-marketing és /e-mail-marketing-best-practices-b2b. A második a specifikusságot jelzi. Valószínűbb, hogy a felszínre kerül, amikor egy mesterséges intelligencia rendszer választ generál egy pontos kérdésre, mivel maga az URL leszűkíti a relevancia hatókörét, még mielőtt a tartalom elemzésre kerülne.

Legyen összhangban a kategóriaelnevezéssel az egész webhelyen

Ha a tartalomstratégiája használja /guides/ a hosszú távú oktatási tartalmak és /blog/ rövidebb kommentárhoz tartsd ezt következetesen. Valószínű, hogy a mesterséges intelligencia visszakereső rendszerek idővel modellt építenek a webhely szerkezetéről. Az inkonzisztencia elhomályosítja a jelzést arról, hogy milyen típusú tartalom hol él.

Kerülje el a kulcsszavak eltömődését az URL-ekben

Ez régi SEO tanács, de itt is érvényes. A kulcsszavakkal telezsúfolt URL spamnek tűnik az emberi felhasználók számára, akik azt látják, hogy egy mesterséges intelligencia válaszában hivatkoznak rá, ami aláássa az Ön által kiépíteni kívánt bizalmi előnyt. Szegmensenként egy elsődleges kulcsszó vagy kifejezés a megfelelő hívás.

Hogyan néz ki ez a gyakorlatban

Ha két különböző marketingszakember ír ugyanarról a témáról, akkor az URL-struktúra kulcsfontosságú lehet a RAG-rendszerek számára, hogy jobban megértsék az oldal kontextusát a tartalomkeresés részeként.

Egy példa:

A marketingszakértő közzéteszi /blog/2024/03/email-tips-part-4.

Marketer B közzéteszi /resources/email-marketing/b2b-deliverability-guide.

A B marketinges URL-struktúrája megfelelően kommunikálja a hierarchiát (erőforrás-központ), a kategóriát (e-mailes marketing) és a konkrét fókuszt (B2B kézbesíthetőség), mielőtt a törzsmásolat egyetlen szava is feldolgozásra kerülne.

A felhasználók nagyobb valószínűséggel profitálnak majd abból, ha ezt az URL-t idézik, mert azonnal megérthetik.

Vitatható, hogy ez a fajta egyértelműség és pontosság összefonódhat, mivel az URL-struktúra és a webhely információs architektúrája meghatározhatja a webhely teljes aktuális struktúráját, és elősegítheti a szakértelem és a relevancia kommunikálását.

Az átirányítási és konszolidációs probléma

Ez inkább azokra a vállalati webhelyekre vonatkozik, amelyek URL-tartozásokat halmoztak fel, például átirányításokat, ismétlődő útvonalakat és a tartalomkezelő rendszer korábbi áttelepítései miatt következetlen hibákat.

Ez konkrét problémát okozhat a mesterséges intelligencia lekérésében, ha vannak átirányítási láncok és duplikált útvonalak, mivel előfordulhat, hogy a bejárók nem érkeznek meg következetesen az oldal kanonikus verziójára, és a különböző visszakeresési rendszerek eltérően kezelik az átirányítási felbontást.

A gyakorlati megoldás a webhely URL-címeinek prioritása lesz. Vizsgálja felül a legnagyobb forgalmú és legértékesebb oldalakat, és győződjön meg arról, hogy a gyűjtő-URL-ek tiszták, hozzáférhetőek és a jelenlegi taxonómiájának megfelelő szerkezetűek.

Ezután dolgozzon visszafelé.

Nem kell az egész webhelyet átstrukturálnia annak esélye érdekében, hogy az AI-válaszokban hivatkozzanak rá, de különösen a legnagyobb értékű oldalak esetében gondoskodnia kell arról, hogy a lehető legjobb URL-jeleket kínálja.

Amit nem érdemes megváltoztatni

Fontos, hogy ne hajszolja mindig a nagyot és fényeset, ezért ne alakítsa át teljesen a teljes webhely URL-architektúráját, csak a mesterséges intelligencia visszakeresésének minimális előnye érdekében.

Az URL-ek átstrukturálása valós SEO-kockázattal és idővel jár a linkek saját tőkéjének helyreállításához, ha 301-es átirányítást vezetnek be – és számos webes migrációs rémtörténet bizonyítja, hogy mi történhet, ha nincsenek megfelelően implementálva.

A cél az, hogy ezeket az elveket alkalmazzuk az új tartalomra, és megjelöljük a strukturális problémákat a meglévő nagy értékű oldalakon, ahol egyértelmű és alacsonyabb kockázatú ezeknek a problémáknak a megoldása.

Ha a jelenlegi URL-struktúra már tiszta, leíró, hierarchikus konvenciókat követ (ami a SEO bevált gyakorlatának szokásos része), akkor gratulálunk! Ön úgy optimalizált a mesterséges intelligencia lekérésére, hogy nem is tudta.

Összefoglalóban

Az URL-struktúra mindig is viszonylag kis jelzés volt, de ahogy az AI-asszisztensek egyre inkább értelmes felfedezési csatornává válnak, az URL-struktúrákra több helyen is hivatkozhatnak, nem csak a Google-on és a Bingen.

Segíthetnek abban, hogy megjelenjen a mesterséges intelligencia által generált válaszokban, alakíthatják az idézet minőségét, és hozzájárulhatnak ahhoz, hogy a visszakereső rendszerek miként kategorizálják a tartalmat minden más előtt.

Egyszerűen hozzon létre URL-eket, amelyek világosan elmondják a tartalom történetét, még mielőtt a felhasználó rákattintna.