A Google John Mueller a Search Console-lal és a 404-es hibajelentéssel kapcsolatos kérdésére válaszolva azt sugallja, hogy a 404-es állapotkóddal rendelkező oldalak ismételt feltérképezése pozitív jelzés.
404 Állapotkód
A 404-es állapotkód, amelyet gyakran hibakódként is emlegetnek, régóta összezavarta sok webhelytulajdonost és keresőoptimalizálót, mivel a „hiba” szó azt sugallja, hogy valami elromlott, és javításra szorul. De ez nem így van.
A 404 egyszerűen egy állapotkód, amelyet a szerver küld egy böngésző oldalkérésére válaszul. A 404 egy üzenet, amely közli, hogy a keresett oldal nem található. Az egyetlen hiba maga a kérés, mert az oldal nem létezik.
Bár általában 404-es hibának nevezik, technikailag a formális név 404 nem található. Ez a név pontosan tükrözi a 404-es állapotkód jelentését: a keresett oldal nem található.
Képernyőkép a 4o4-es állapotkód hivatalos webszabványáról
A Google folyamatosan feltérképezi a 404-es oldalakat
Valaki a Redditről azt írta, hogy a Google Search Console folyamatosan arról számol be, hogy a már nem létező oldalak továbbra is megtalálhatók a webhelytérkép-adatokon keresztül, annak ellenére, hogy a webhelytérkép már nem sorolja fel a hiányzó oldalakat.
A személy azt állítja, hogy a Search Console feltérképezi a hiányzó oldalakat, de valójában a Googlebot az, amelyik feltérképezi őket; A Search Console csupán a sikertelen feltérképezéseket jelenti.
Aggódnak az elpazarolt feltérképezési költségvetés miatt, és tudni akarják, hogy küldjenek-e helyette 410-es válaszkódot.
Azt írták:
„A Google Search Console még mindig feltérképez egy csomó nem létező oldalt, amelyek 404-es értéket adnak vissza. Az Oldal-ellenőrző eszközben és a Feltérképezési Statisztikákban azt írja ki, hogy ezeket az oldal-sitemap.xml-emen keresztül „fedezték fel”.
A probléma:
Amikor most megnyitom a tényleges page-sitemap.xml fájlt a böngészőben, a 404-es URL-ek egyike sincs benne.
Az oldaltérkép csak 21 jó, élő oldalt tartalmaz.
…nem szeretném törölni vagy leállítani az oldaltérkép beküldését, mert az tiszta és csak jó oldalakra mutat. De ezek az ismételt feltérképezések pazarolják a feltérképezési költségkeretet.
Valaki találkozott már ilyennel?
A Google végül megáll magától?
Cseréljem a 404-eseket 410 Gone-ra?
Vagy van más módja annak, hogy elmondja a GSC-nek, hogy „hé, ezek örökre eltűntek”?
A Google 404-es oldalfeltérképezéséről
A Google régi gyakorlata 404 oldal feltérképezése arra az esetre, ha az oldalakat véletlenül eltávolították volna, és visszaállították volna. Amint azt egy pillanat alatt látni fogja, a Google John Mueller határozottan kijelenti, hogy az ismételt 404-es oldalak feltérképezése azt jelzi, hogy a Google rendszerei pozitív színben tekinthetik a tartalmat.
A 404-es oldalról nem található válasz
A 404-es állapotkód hivatalos webes szabvány definíciója szerint a kért erőforrás nem található, és ez az, semmi több. Ez a válasz nem azt jelenti, hogy az oldal soha nem tér vissza. Ez egyszerűen azt jelenti, hogy a keresett oldal nem található.
Körülbelül 410 Gone Response
A 410-es állapotkód hivatalos webes szabványa szerint az oldal eltűnt, és az eltűnt állapot valószínűleg végleges. A válasz célja annak közlése, hogy az erőforrások szándékosan eltűntek, és az ezekre az erőforrásokra mutató hivatkozásokat el kell távolítani.
A Google lényegében ugyanazt kezeli a 404-es és a 410-es
Technikailag, ha egy weboldal végleg eltűnt, és soha többé nem jön vissza, akkor a 410 a megfelelő szerverüzenet, amelyet el kell küldeni a hiányzó oldalra vonatkozó kérésekre. A gyakorlatban a Google a 410-es választ gyakorlatilag ugyanúgy kezeli, mint a 404-es szerverválaszt. Hasonlóan ahhoz, ahogyan a 404-es válaszokat kezeli, a Google feltérképező robotjai továbbra is visszatérhetnek ellenőrizni, hogy a 410-es válaszoldal eltűnt-e.
A Google munkatársai következetesen azt mondják, hogy a 410-es szerver válasza valamivel gyorsabb, ha egy oldalt töröl a Google indexéből.
A Google megerősíti a 404-es és 410-es válaszkódokkal kapcsolatos tényeket
A Google Mueller rövid, de információdús válasszal válaszolt, amely kifejtette, hogy a Search Console-ban jelentett 404-esek nem olyan probléma, amelyet javítani kell, a 410-es válasz elküldése nem befolyásolja a Search Console 404-es jelentését, és a jelentésben szereplő URL-ek sokasága pozitívan értékelhető.
Mueller így válaszolt:
„Ezek nem okoznak problémát, ezért hagynám őket békén. Lehetséges, hogy hosszú ideig újra feltérképezik őket, a 410-es nem változtat ezen. Ez bizonyos értelemben azt jelenti, hogy a Google-nak megfelelő lenne, ha több tartalmat venne fel az Ön webhelyéről.”
Félreértések a 4XX szerverválaszokkal kapcsolatban
A vita a Redditen folytatódott. Az r/SEO subreddit moderátora azt javasolta, hogy a Search Console azért jelentette, hogy felfedezte az URL-t a webhelytérképen, mert a Googlebot eredetileg itt találta meg az URL-t, ami ésszerűen hangzik.
A moderátor tévedett, amikor elmagyarázta, mit jelent a 404-es válaszkód.
A moderátor rosszul magyarázta:
„A 404 lényegében azt jelenti, hogy az oldal elromlott, hamarosan kijavítjuk, nézz vissza: és a Google is ezt teszi – visszanéz, hogy javította-e.”
A moderátor két hibát vét a válaszában.
1. 404 Azt jelenti, hogy az oldal nem található
A 404-es állapotkód csak azt jelenti, hogy az oldal nem található, pont. Ne higgy nekem? Íme a 404-es állapotkód hivatalos webes szabványa:
„A 404-es (Nem található) állapotkód azt jelzi, hogy a kiindulási szerver nem talált aktuális reprezentációt a célerőforráshoz, vagy nem hajlandó felfedni, hogy létezik. A 404-es állapotkód nem jelzi, hogy a reprezentáció hiánya ideiglenes vagy állandó…”
2. A 404 nem javításra szoruló hiba
Az emberek általában hibareakcióként hivatkoznak a 404-es állapotkódra. A hiba azért van, mert a böngésző vagy a robot olyan URL-t kért, amely nem létezik, ami azt jelenti, hogy a kérés volt a hiba, nem pedig azt, hogy az oldalt javítani kell, ahogy a moderátor ragaszkodott hozzá, amikor azt mondta, hogy „a 404 lényegében azt jelenti, hogy az oldal megszakadt”, ami 100%-ban helytelen.
Ezenkívül a Reddit moderátora helytelenül hangoztatta, hogy a Google „visszanéz, hogy kijavította-e”. A Google visszanéz, hogy nem tűnt-e el véletlenül az oldal, de ez nem jelenti azt, hogy a 404-et javítani kell. Az esetek többségében egy oldal okkal eltűnt, és a Google 404-es válaszkód megjelenítését javasolja ilyenkor.
Ez nem új
Ez nem arról szól, hogy a Reddit moderátorának információi elavultak. Ez mindig is így volt a Google esetében, amely általában követi a hivatalos webes szabványokat.
A Google munkatársa, Matt Cutts egy 2014-es videóban elmagyarázta, hogyan kezeli a Google a 404-eseket, és miért:
„Kiderült, hogy a webmesterek elég gyakran lábon lövik magukat. Eltűnnek az oldalak, az emberek rosszul konfigurálják a webhelyeket, a webhelyek leállnak, az emberek véletlenül blokkolják a Googlebotot, az emberek véletlenül blokkolják a normál felhasználókat. Tehát ha az egész internetet nézi, a feltérképezési csapatnak robusztusnak kell lennie ez ellen.
Tehát a 404-esekkel… huszonnégy órán keresztül védjük az oldalt a feltérképező rendszerben. Szóval várunk, és azt mondjuk, hát, talán ez egy átmeneti 404 volt. Talán nem igazán az volt a cél, hogy egy oldal nem található. Így a bejáró rendszerben huszonnégy órán keresztül védett lesz.
…Most ne vegye ezt túlságosan rossz irányba, még mindig visszamegyünk, és újra ellenőrizzük, és megbizonyosodunk arról, hogy ezek az oldalak valóban eltűntek-e, vagy talán az oldalak újra életre keltek.
…És tehát, ha egy oldal eltűnt, akkor rendben van, ha 404-est szolgál ki. Ha tudod, hogy valóban eltűnt, akkor jó, ha kiszolgálsz egy 410-est.
De a bejáró rendszerünket úgy tervezzük meg, hogy az robusztus legyen. De ha a webhelye leáll, vagy ha feltörik, vagy bármi más, akkor igyekszünk biztosítani, hogy továbbra is megtaláljuk a jó tartalmat, amikor az elérhető.”
Az elvihető ételek
- A 404 oldalt feltérképező Googlebot pozitív jelnek tekinthető, hogy a Google-nak tetszik az Ön tartalma.
- A 404-es állapotkód nem jelenti azt, hogy az oldal hibás; ez azt jelenti, hogy egy oldal nem található.
- A 404-es állapotkódok nem jelentik azt, hogy valamit javítani kell. Ez csak azt jelenti, hogy a keresett oldal nem található.
- Nincs semmi baj a 404-es válaszkód kiszolgálásával; A Google ajánlja.
- A Search Console 404 választ jelenít meg, így a webhely tulajdonosa eldöntheti, hogy ezek az oldalak szándékosan eltűntek-e vagy sem.
