A Lighthouse sikertelen az Llms.txt fájlban Markdown hivatkozások nélkül

Peter

A Chrome új Lighthouse Agentic Browsing auditja kezeli az Ön igényeit .txt fájl leértékelési dokumentumként. Ha az llms.txt fájl nem használja a leértékelési hivatkozás szintaxisát, akkor meghiúsul az ellenőrzés, még akkor is, ha a fájl minden hivatkozása pontos és működik. Lefuttattam az auditot a nohacks.co oldalon. Hat ellenőrzésből kettő sikeres volt. Három jött vissza nem alkalmazható. Az egyik meghiúsult: az llms.txt audit, a szó szerinti hibával „Úgy tűnik, hogy a fájl nem tartalmaz hivatkozásokat.” A javítás linkenként öt karakterből állt. A fájl továbbra is egyszerű szövegként jelenik meg. Csak az ellenőrzés eredménye változott.

A Lighthouse 13.3.0 a teljesítmény, a kisegítő lehetőségek, a keresőoptimalizálás és a legjobb gyakorlatok mellett az Ügynöki böngészés kategóriát is szállította. Hat audit az alapértelmezett készletben: az akadálymentesítési fa jól formáltsága (agent-accessibility-tree), kumulatív elrendezés eltolás (cumulative-layout-shift), llms.txt felfedezhetősége (llms-txt), és három WebMCP ellenőrzés (webmcp-registered-tools, webmcp-form-coverage, webmcp-schema-validity). A kategória tört arányt ad vissza a 0-100-as pontszám helyett, mivel az ügynökháló szabványai még mindig mozgásban vannak.

6 auditból 1 sikertelen volt a Nohacks.co oldalon

Az auditot a Lighthouse CLI-n keresztül futtattam: npx lighthouse@latest https://nohacks.co --only-categories=agentic-browsing. Hat audit érkezett vissza. Három nem alkalmazható, mindegyik WebMCP: webmcp-registered-tools, webmcp-form-coverageés webmcp-schema-validity. A Lighthouse nem ad okot a nem alkalmazható eredményre, csak megjelöli az auditot és továbbmegy. A nohacks.co felfedi a WebMCP-t, de csak a kísérleti kényszer révén navigator.modelContext API (két szószedet eszköz, kettő egy ügynök-böngésző címtárhoz), deklaratív űrlap megjegyzések nélkül. A vizsgálat egy alapértelmezett, fej nélküli Chrome 150-ben futott, WebMCP-jelző nélkül, így a nem alkalmazható ítélet azt jelentheti, hogy a webhely nem tár fel semmit, amit ezek az ellenőrzések felismernek, vagy hogy a vizsgálati környezetben nem volt aktív WebMCP API. A Lighthouse nem mondja meg, melyik. Két audit sikeres volt: agent-accessibility-tree jelentették „Minden ellenőrzés sikeres volt” megerősíti, hogy a szemantikai HTML és ARIA szerkezet elég jól formált ahhoz, hogy az ügynökök navigálhassanak, és cumulative-layout-shift nullára jött vissza.

Egy audit nem sikerült: llms-txt. A Lighthouse szó szerinti hibaüzenete a következő volt:

Úgy tűnik, hogy a fájl nem tartalmaz hivatkozásokat.

A kategória pontszáma 0,67 volt. Ez volt az első meglepetés. A nohacks.co/llms.txt fájl számos hivatkozást tartalmaz. Navigációs útvonalak cikkekhez, epizódokhoz, vendégekhez, szószedethez. RSS feed URL-ek. Hangfájl URL-mintái. A fájl több mint öt kilobájt strukturált tartalommal rendelkezik. Tehát miért jelentett a Lighthouse nulla linket?

Világítótorony elemzi .txt Markdownként és elutasítja az egyszerű szöveges hivatkozásokat

A fájl kiterjesztése az .txtde a Lighthouse leértékelésként elemzi a tartalmat, és megköveteli a leértékelési hivatkozás szintaxisát, hogy bármely szöveg hivatkozásnak számítson. A fájl neve llms.txt. A HTTP szerver a következővel adja vissza text/plain MIME típus. Nyissa meg egy böngészőben, és sima szöveget fog látni. De az llmstxt.org webhelyen található llms.txt specifikáció a formátumot leértékelési dokumentumként határozza meg. A specifikáció egyértelmű: „Minden szakasz tartalmaz egy linklistát. Minden listaelemhez tartozik egy hivatkozás, amelyet a hivatkozásra vonatkozó opcionális megjegyzések követnek, kettősponttal elválasztva a hivatkozástól.” A Lighthouse elemzője ezt szigorúan betartja. Minden hivatkozást markdown link szintaxisként kell kódolni, [text](url)szögletes zárójelekkel a hivatkozás szövege körül és zárójelekkel az URL körül.

A fájlom természetesebb egyszerű szöveges formátumot használt:

- Homepage: / - Publication masthead, cornerstone series, latest articles and episodes
- Articles: /blog - All articles on AXO, the agentic web, and AI agents
- Episode: /episode/[slug] - Full show notes, transcript, audio player

Ugyanazok az úti célok. Ugyanazok a leírások. Ugyanaz az információ. A Lighthouse elemzője nem regisztrálja ezeket a sorokat hivatkozásként. A teljes fájlban pontosan nullát regisztrált. Az ellenőrzés sikertelen.

Egy fájl a .txt kiterjesztés, tálalva a text/plain MIME-típus, amely sikertelen az auditálás során, hacsak nincs leértékelésként formázva. Ez olyan eltérés, amelyben az ellenőrzési rétegnek őszintébbnek kell lennie. A kiterjesztés egyet mond. A MIME típus egy dolgot mond. Az elemző az igazság forrása, az elemző pedig leértékelést követel.

A javítás linkenként 5 karakterből áll

Az egyes hivatkozási célokat a markdown bracket-paren szintaxisba csomagolja, [text](url)és cserélje ki a - elválasztóval minden leírás előtt : . Linkenként öt karakter. Mechanikus átalakítás, ismétlődő a fájlban.

- [Homepage](/): Publication masthead, cornerstone series, latest articles and episodes
- [Articles](/blog): All articles on AXO, the agentic web, and AI agents
- [Episode](/episode/[slug]): Full show notes, transcript, audio player

Megcsináltam a szerkesztést. Futtassa újra az auditot. A pontszám 0,67-ről 1,0-ra nőtt. Az audit címe elfordult „Az llms.txt nem követi az ajánlásokat” hogy „Az llms.txt követi az ajánlásokat.” Nincsenek részletek az utójelentésben. Tiszta bérlet.

A fájl továbbra is mint text/plain. A fájl kiterjesztése továbbra is fennáll .txt. A fájl tartalma továbbra is ugyanaz. Csak a link kódolása módosult.

A Lighthouse az elemzhető hivatkozás szintaxisát méri, nem a fájl minőségét

Az ellenőrzés ellenőrzi, hogy a fájl mechanikusan elemezhető-e. Nem ellenőrzi, hogy a fájl hasznosan írja-e le webhelyét. Mindkét olvasat igaz egyszerre.

Az első szöveg: Az audit valami valós mérést jelent. A Markdown link szintaxisa mechanikusan elemezhető. Az egyszerű szöveges leíró sorok nem. Ha egy AI-ügynöknek (vagy az ügynök helyett a Lighthouse elemzőnek) programozottan kell kivonnia a hivatkozásokat a fájlból, akkor a leértékelési formátum szükséges. Az ellenőrzés helyes, hogy a javításom előtti fájlt nem lehetett a szabványos eszközökkel elemezni a hivatkozásokhoz. A markdown link szintaxisára való átalakítás valódi interoperabilitási hiányosságot javít ki.

A második olvasat: a formátum megfelelősége nem azonos a fájl minőségével. Az átgondoltan megírt, pontos, átfogó llms.txt, amely egyszerű szöveges leírásokat használ, nem felel meg az ellenőrzésnek. Vékony, automatikusan generált llms.txt a leértékelési hivatkozás szintaxisával. Az audit nem tud különbséget tenni a kettő között. Az AIOSEO WordPress beépülő modul, amelyet több mint 3 millió webhely használ a WordPress.org listája alapján, alapértelmezés szerint llms.txt fájlokat hoz létre markdown link szintaxissal, amely Glenn Gabe alapértelmezett viselkedése merült fel, és ezt a beépülő modul saját dokumentációja is megerősíti. Ezek az automatikusan generált fájlok markdown link szintaxist használnak, mert a generátor ezt adja ki. A legtöbben valószínűleg átmennek ezen az ellenőrzésen. A legtöbb kézzel gondozott, tulajdonos által ismert llms.txt fájl valószínűleg sikertelen.

Ezt a hiányosságot érdemes átgondolni, mielőtt az audit sikerességét/sikertelenségét annak méréseként kezelné, hogy webhelye mennyire kész az ügynökök számára. Az ellenőrzés azt ellenőrzi, hogy a fájl elemezhető-e. Nem ellenőrzi, hogy a fájl hasznos-e.

Érdekelne a Lighthouse Agentic Browsing Llms.txt ellenőrzése?

Igen, de szűken. A Lighthouse meg tudja mondani, hogy az llms.txt elemezhető-e leértékelésként. Nem tudja megmondani, hogy a fájl őszintén leírja-e webhelyét. Ez a csekk a tiéd. Nyissa meg a Chrome DevTools alkalmazást, kattintson a Lighthouse fülre, ellenőrizze, hogy az Ügynöki böngészés kategória be van jelölve, és futtassa az Elemzést az URL-címén. Az ellenőrzés kevesebb mint egy percet vesz igénybe. Ha nem sikerül a linkek nélküli hiba esetén, a javítás linkenként öt karakterből áll, és öt perc szerkesztési időt vesz igénybe. Ha átmegy, a nehezebb kérdés az, amit a Lighthouse nem tehet fel. A fájlt automatikusan egy olyan bővítmény hozta létre, amelyet nem Ön konfigurált, vagy saját maga írta, és leírja-e, hogy valójában mi is a webhelye?

A gép-első architektúra Szerkezeti pillér mindezek mögött rejlik: adatmodellek az oldalelrendezések előtt, a renderelés függetlensége, a tartalom, amely nem függ a kliensoldali JavaScript-től vagy az emberi megjelenítési alapértelmezés szerint géppel olvasható. Az llms.txt audit egy szűk körű ellenőrzés ezen a rétegen. A nagyobb szerkezeti kérdés, hogy a géppel olvasható felület pontosan leírja-e webhelyét, az Ön feladata.


Ez a bejegyzés eredetileg a No Hacks oldalon jelent meg.


A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.