A Google feltárja az LLMs.txt alapvető hibáját

A Google munkatársa, John Mueller és Martin Splitt az LLMs.txt-ről és a leértékelésről beszélt, miközben Mueller meglepő tényt közölt az LLMs.txt eredeti céljáról, és azt is elmagyarázta, hogy a javasolt szabványoknak miért vannak súlyos hiányosságai.

Mi a felfedezés és miért számít

Az információ-visszakeresés (keresés) összefüggésében a felfedezés arról szól, hogy a keresőmotor felfedezi, hogy egy adott weboldal létezik. A Discovery a keresőmotor általános architektúrájának része.

A keresőmotor architektúrája:

Felfedezés
Az URL felfedezése (hozzáadása a feltérképezéshez).
Csúszó
A tartalom letöltése és elemzése.
Indexelés
A nyers adatok elemzésének és a visszakeresésre optimalizált strukturált adatbázisban való tárolásának folyamata.
Rangsorolás
Az a rész, ami mindenkit érdekel.
Szolgáló
Ez az utolsó lépés, amely a rangsorolt weboldalakat a keresési eredmények között jeleníti meg.

A fenti egy leegyszerűsített áttekintést nyújt a keresésről, és a Discovery a folyamat legelső része, amely végül a webhelyekre mutató rangsorolással és a hivatkozások megjelenítésével végződik.

A lényeg az, hogy a Discovery kulcsfontosságú szerepet játszik abban, hogy egy weboldal feltérképezhető, indexelve, rangsorolva, és végül megjelenjen a keresési eredmények között. Discovery nélkül egy weboldal láthatatlan.

Nos, ez miért fontos: A Discovery nem része a javasolt LLMs.txt szabványnak. használat

Az LLMs.txt eredeti szándéka

John Mueller elmondta, hogy találkozott az LLMs.txt javaslat létrehozásáért felelős egyik emberrel, és elmondta, hogy az alkotó elmagyarázta, hogy az LLMs.txt soha nem az volt, hogy egy webhelyet felfedezhetővé tegyen, és soha nem volt az a célja, hogy része legyen ennek a folyamatnak.

Ez azért fontos szempont, mert sok webhelytulajdonos időt, pénzt és erőfeszítést költ az LLMs.txt létrehozására annak érdekében, hogy felfedezzék és rangsorolják az LLM-eket. Ez azt jelenti, hogy az LLMs.txt használatának oka ütközik az LLMs.txt tényleges céljával, aminek semmi köze a Discovery-hez.

Mueller elmagyarázta:

„Szóval, azt hiszem, beszélgettem az egyik emberrel, aki létrehozta ezt a javaslatot egy ideje. És az ötlet valójában nem az volt, hogy olyan dolgot hozzunk létre, amely megkönnyíti a keresőmotorok vagy az LLM-rendszerek számára az Ön teljes tartalmának felfedezését, hanem sokkal inkább az volt, hogy ha egy LLM már ismeri az Ön webhelyét, és meg akarja tudni, mi van még itt, akkor ez egy megközelítés lehet.

És úgy gondolom, hogy ennek semmi értelme nincs annak a szempontnak, hogy ezt a Discovery by AI rendszerekre vagy a Discovery by keresőrendszerekre való optimalizálásra használjuk.”

Mueller ezután kifejtette, hogy sokan használják az LLMs.txt fájlt abban a reményben, hogy segítik a Discovery folyamatát, annak ellenére, hogy az LLMs.txt nem ez a célja.

Ezután arra a tényre tért ki, hogy az LLMs.txt eleve megbízhatatlan, mert a webhely tulajdonosa mondja meg, hogy miről szól a webhelyük tartalma, ami lehet, hogy megegyezik a tényleges HTML-ben lévővel, de lehet, hogy nem.

Így folytatta:

„Mert alapvetően azt mondod ezeknek a rendszereknek, hogy nekem van a valaha volt legjobb webhelyem. És itt van az összes oldal, amelyet mindenkinek fel kell keresnie. És meg kell vásárolnia az összes termékemet, vagy bármit, amit berak.

Tehát egy LLM-rendszerben… alapvetően a tervezésből adódóan nem bízhat abban, ami itt van, mint a különböző webhelyek megkülönböztetésének módja.”

Ügynöki utasítások

Mueller ezután azt mondja, hogy a szabványjavaslatok némelyike hasznos lehet egy AI-ügynök segítésében, ami úgy hangzik, mintha a Web Model Context Protocolról (WebMCP) beszélne.

Elmagyarázta:

„Ha valaki már felkeresi a webhelyét, talán valamilyen automatizált rendszer segít. Ha ez megy, szeretnék elmenni Martin’s Splittbe és vásárolni egy fényképet, akkor az LLM rendszer felkeresheti a webhelyét, és körülnézhet, például, hogyan vásárolhat fényképet? Lehet, hogy van néhány útmutatása nekem, mint ügynöknek a fényképek vásárlásához. Ennek van értelme.

De ha kimegyek, és azt mondják, szeretnék vásárolni egy fényképet, amelyik webhelyen van ilyen, a rendszer nem megy az Ön webhelyére és öt másik oldalra, és azt mondja, kinek van automatizált információja? De inkább megpróbálják megtalálni a legjobb webhelyet…”

Az LLMs.txt nem arról szól, hogy az AI felfedezze

Mueller visszatért arra, hogy az emberek hogyan értelmezik félre az LLMs.txt fájlt az AI-rendszerek általi felfedezés módjaként.

Ezzel kapcsolatban így okoskodott:

„Szerintem ebből a szempontból az optimalizálásnak, mint a felfedezés egyik módja, nincs értelme.

De mi történik, ha egy ügynök van a webhelyén? Úgy gondolom, hogy ez is csak általánosságban nyitott területnek tűnik jelenleg a megbeszélések számára, mivel ott van az LLMs.txt javaslatként. Különböző JSON-fájlok és jól ismert fájltípusok vannak vitában.

Van a WebMCP, ami szerintem valami hasonlót próbál csinálni, ahol azt mondják, hogy na, most ezen az oldalon vagy, de ehhez van egy programozott felületünk, hozzáadtunk egy konkrét URL-t vagy egy konkrét mechanizmust.

Azt hiszem, ezek szinte különböző viták.”

A felfedezés és a rangsorolás továbbra is a HTML-hez kötődik

Mueller azzal fejezte be gondolatát, hogy aláhúzta, hogy a Discovery HTML-szintű.

Elmagyarázta:

„Tehát az általános SEO-szemlélet, hogy hogyan találhatok meg egy weboldalt, amelyen fényképet adnak el, szinte teljesen HTML-oldalakhoz és normál weboldalakhoz lesz kötve.

És akkor, ha a felhasználó úgy dönt, hogy egy adott szolgáltatást keres, akkor azon belül egy kicsit több hely áll rendelkezésre, hogy segítsen egy ügynöknek vagy egy LLM-rendszernek megtalálni a megfelelő megközelítést.

De ami persze érdekes, az a sok ötlet. És ezek egyike sem kristályosodott ki úgy, mint az egyetlen dolog, amelyet mindenki használni fog. Szóval biztos vagyok benne, hogy a következő, nem tudom, fél év, év, vagy esetleg tovább, eltart egy kicsit. És ezen ügynökrendszerek némelyike egyesülni fog valamilyen szabványos fájltípus, mechanizmus vagy valami körül.

Mueller nem a WebMCP szabványt szorgalmazta, de ha a mesterséges intelligencia ügynökei a felhasználók webhelyekkel való interakciós módjává válnak, akkor valami olyan lesz, mint a WebMCP, és nem az LLMs.txt, amely hasznos lesz a webhelyeken, különösen az e-kereskedelmi webhelyeken.

A WebMCP természetesen jobban illeszkedik az e-kereskedelemhez, mert arra összpontosít, hogy a mesterséges intelligencia ügynökei használható képességeket biztosítsanak, például hogyan szűrjenek termékeket, hogyan keressenek és azonosítsanak termékeket, segít a különböző termékek összehasonlításában, és segíti az AI-t a termék bevásárlókosárba helyezésében.

Az AI-ügynökök képesek navigálni a webhely HTML-kódjával, amelyet emberek számára terveztek. A WebMCP megkönnyíti az AI-ügynökök számára a webhelyekkel való sikeres interakciót, amit az LLMs.txt nem tesz meg.

Bár sem az LLMs.txt, sem a WebMCP nem segíti elő, hogy az AI felfedezze a webhelyet, egyiket sem erre a célra hozták létre. A Discovery rész, a rangsorolás első szakasza, mind a HTML-lel történik. Ha ez a helyzet, mi a következő lépése?

Hallgassa meg a Google keresését Off The Record 111. epizódjában