A Chrome új Lighthouse Agentic Browsing auditja kezeli az Ön igényeit .txt fájl leértékelési dokumentumként. Ha az llms.txt fájl nem használja a leértékelési hivatkozás szintaxisát, akkor meghiúsul az ellenőrzés, még akkor is, ha a fájl minden hivatkozása pontos és működik. Lefuttattam az auditot a nohacks.co oldalon. Hat ellenőrzésből kettő sikeres volt. Három jött vissza nem alkalmazható. Az egyik meghiúsult: az llms.txt audit, a szó szerinti hibával „Úgy tűnik, hogy a fájl nem tartalmaz hivatkozásokat.” A javítás linkenként öt karakterből állt. A fájl továbbra is egyszerű szövegként jelenik meg. Csak az ellenőrzés eredménye változott.
A Lighthouse 13.3.0 a teljesítmény, a kisegítő lehetőségek, a keresőoptimalizálás és a legjobb gyakorlatok mellett az Ügynöki böngészés kategóriát is szállította. Hat audit az alapértelmezett készletben: az akadálymentesítési fa jól formáltsága (agent-accessibility-tree), kumulatív elrendezés eltolás (cumulative-layout-shift), llms.txt felfedezhetősége (llms-txt), és három WebMCP ellenőrzés (webmcp-registered-tools, webmcp-form-coverage, webmcp-schema-validity). A kategória tört arányt ad vissza a 0-100-as pontszám helyett, mivel az ügynökháló szabványai még mindig mozgásban vannak.
6 auditból 1 sikertelen volt a Nohacks.co oldalon
Az auditot a Lighthouse CLI-n keresztül futtattam: npx lighthouse@latest https://nohacks.co --only-categories=agentic-browsing. Hat audit érkezett vissza. Három nem alkalmazható, mindegyik WebMCP: webmcp-registered-tools, webmcp-form-coverageés webmcp-schema-validity. A Lighthouse nem ad okot a nem alkalmazható eredményre, csak megjelöli az auditot és továbbmegy. A nohacks.co felfedi a WebMCP-t, de csak a kísérleti kényszer révén navigator.modelContext API (két szószedet eszköz, kettő egy ügynök-böngésző címtárhoz), deklaratív űrlap megjegyzések nélkül. A vizsgálat egy alapértelmezett, fej nélküli Chrome 150-ben futott, WebMCP-jelző nélkül, így a nem alkalmazható ítélet azt jelentheti, hogy a webhely nem tár fel semmit, amit ezek az ellenőrzések felismernek, vagy hogy a vizsgálati környezetben nem volt aktív WebMCP API. A Lighthouse nem mondja meg, melyik. Két audit sikeres volt: agent-accessibility-tree jelentették „Minden ellenőrzés sikeres volt” megerősíti, hogy a szemantikai HTML és ARIA szerkezet elég jól formált ahhoz, hogy az ügynökök navigálhassanak, és cumulative-layout-shift nullára jött vissza.
Egy audit nem sikerült: llms-txt. A Lighthouse szó szerinti hibaüzenete a következő volt:
Úgy tűnik, hogy a fájl nem tartalmaz hivatkozásokat.
A kategória pontszáma 0,67 volt. Ez volt az első meglepetés. A nohacks.co/llms.txt fájl számos hivatkozást tartalmaz. Navigációs útvonalak cikkekhez, epizódokhoz, vendégekhez, szószedethez. RSS feed URL-ek. Hangfájl URL-mintái. A fájl több mint öt kilobájt strukturált tartalommal rendelkezik. Tehát miért jelentett a Lighthouse nulla linket?
Világítótorony elemzi .txt Markdownként és elutasítja az egyszerű szöveges hivatkozásokat
A fájl kiterjesztése az .txtde a Lighthouse leértékelésként elemzi a tartalmat, és megköveteli a leértékelési hivatkozás szintaxisát, hogy bármely szöveg hivatkozásnak számítson. A fájl neve llms.txt. A HTTP szerver a következővel adja vissza text/plain MIME típus. Nyissa meg egy böngészőben, és sima szöveget fog látni. De az llmstxt.org webhelyen található llms.txt specifikáció a formátumot leértékelési dokumentumként határozza meg. A specifikáció egyértelmű: „Minden szakasz tartalmaz egy linklistát. Minden listaelemhez tartozik egy hivatkozás, amelyet a hivatkozásra vonatkozó opcionális megjegyzések követnek, kettősponttal elválasztva a hivatkozástól.” A Lighthouse elemzője ezt szigorúan betartja. Minden hivatkozást markdown link szintaxisként kell kódolni, [text](url)szögletes zárójelekkel a hivatkozás szövege körül és zárójelekkel az URL körül.
A fájlom természetesebb egyszerű szöveges formátumot használt:
- Homepage: / - Publication masthead, cornerstone series, latest articles and episodes
- Articles: /blog - All articles on AXO, the agentic web, and AI agents
- Episode: /episode/[slug] - Full show notes, transcript, audio player
Ugyanazok az úti célok. Ugyanazok a leírások. Ugyanaz az információ. A Lighthouse elemzője nem regisztrálja ezeket a sorokat hivatkozásként. A teljes fájlban pontosan nullát regisztrált. Az ellenőrzés sikertelen.
Egy fájl a .txt kiterjesztés, tálalva a text/plain MIME-típus, amely sikertelen az auditálás során, hacsak nincs leértékelésként formázva. Ez olyan eltérés, amelyben az ellenőrzési rétegnek őszintébbnek kell lennie. A kiterjesztés egyet mond. A MIME típus egy dolgot mond. Az elemző az igazság forrása, az elemző pedig leértékelést követel.
A javítás linkenként 5 karakterből áll
Az egyes hivatkozási célokat a markdown bracket-paren szintaxisba csomagolja, [text](url)és cserélje ki a - elválasztóval minden leírás előtt : . Linkenként öt karakter. Mechanikus átalakítás, ismétlődő a fájlban.
- [Homepage](/): Publication masthead, cornerstone series, latest articles and episodes
- [Articles](/blog): All articles on AXO, the agentic web, and AI agents
- [Episode](/episode/[slug]): Full show notes, transcript, audio player
Megcsináltam a szerkesztést. Futtassa újra az auditot. A pontszám 0,67-ről 1,0-ra nőtt. Az audit címe elfordult „Az llms.txt nem követi az ajánlásokat” hogy „Az llms.txt követi az ajánlásokat.” Nincsenek részletek az utójelentésben. Tiszta bérlet.
A fájl továbbra is mint text/plain. A fájl kiterjesztése továbbra is fennáll .txt. A fájl tartalma továbbra is ugyanaz. Csak a link kódolása módosult.
A Lighthouse az elemzhető hivatkozás szintaxisát méri, nem a fájl minőségét
Az ellenőrzés ellenőrzi, hogy a fájl mechanikusan elemezhető-e. Nem ellenőrzi, hogy a fájl hasznosan írja-e le webhelyét. Mindkét olvasat igaz egyszerre.
Az első szöveg: Az audit valami valós mérést jelent. A Markdown link szintaxisa mechanikusan elemezhető. Az egyszerű szöveges leíró sorok nem. Ha egy AI-ügynöknek (vagy az ügynök helyett a Lighthouse elemzőnek) programozottan kell kivonnia a hivatkozásokat a fájlból, akkor a leértékelési formátum szükséges. Az ellenőrzés helyes, hogy a javításom előtti fájlt nem lehetett a szabványos eszközökkel elemezni a hivatkozásokhoz. A markdown link szintaxisára való átalakítás valódi interoperabilitási hiányosságot javít ki.
A második olvasat: a formátum megfelelősége nem azonos a fájl minőségével. Az átgondoltan megírt, pontos, átfogó llms.txt, amely egyszerű szöveges leírásokat használ, nem felel meg az ellenőrzésnek. Vékony, automatikusan generált llms.txt a leértékelési hivatkozás szintaxisával. Az audit nem tud különbséget tenni a kettő között. Az AIOSEO WordPress beépülő modul, amelyet több mint 3 millió webhely használ a WordPress.org listája alapján, alapértelmezés szerint llms.txt fájlokat hoz létre markdown link szintaxissal, amely Glenn Gabe alapértelmezett viselkedése merült fel, és ezt a beépülő modul saját dokumentációja is megerősíti. Ezek az automatikusan generált fájlok markdown link szintaxist használnak, mert a generátor ezt adja ki. A legtöbben valószínűleg átmennek ezen az ellenőrzésen. A legtöbb kézzel gondozott, tulajdonos által ismert llms.txt fájl valószínűleg sikertelen.
Ezt a hiányosságot érdemes átgondolni, mielőtt az audit sikerességét/sikertelenségét annak méréseként kezelné, hogy webhelye mennyire kész az ügynökök számára. Az ellenőrzés azt ellenőrzi, hogy a fájl elemezhető-e. Nem ellenőrzi, hogy a fájl hasznos-e.
Érdekelne a Lighthouse Agentic Browsing Llms.txt ellenőrzése?
Igen, de szűken. A Lighthouse meg tudja mondani, hogy az llms.txt elemezhető-e leértékelésként. Nem tudja megmondani, hogy a fájl őszintén leírja-e webhelyét. Ez a csekk a tiéd. Nyissa meg a Chrome DevTools alkalmazást, kattintson a Lighthouse fülre, ellenőrizze, hogy az Ügynöki böngészés kategória be van jelölve, és futtassa az Elemzést az URL-címén. Az ellenőrzés kevesebb mint egy percet vesz igénybe. Ha nem sikerül a linkek nélküli hiba esetén, a javítás linkenként öt karakterből áll, és öt perc szerkesztési időt vesz igénybe. Ha átmegy, a nehezebb kérdés az, amit a Lighthouse nem tehet fel. A fájlt automatikusan egy olyan bővítmény hozta létre, amelyet nem Ön konfigurált, vagy saját maga írta, és leírja-e, hogy valójában mi is a webhelye?
A gép-első architektúra Szerkezeti pillér mindezek mögött rejlik: adatmodellek az oldalelrendezések előtt, a renderelés függetlensége, a tartalom, amely nem függ a kliensoldali JavaScript-től vagy az emberi megjelenítési alapértelmezés szerint géppel olvasható. Az llms.txt audit egy szűk körű ellenőrzés ezen a rétegen. A nagyobb szerkezeti kérdés, hogy a géppel olvasható felület pontosan leírja-e webhelyét, az Ön feladata.
Ez a bejegyzés eredetileg a No Hacks oldalon jelent meg.
