WordPress robots.txt: Mit kell felvennie?

Peter

A Humble Robots.txt fájl gyakran csendesen ül a WordPress webhely hátterében, de az alapértelmezés kissé alapvető a dobozból, és természetesen nem járul hozzá a testreszabott irányelvekhez, amelyeket érdemes elfogadni.

Nincs több intro szükséglet – merüljünk bele azzal, amit még be lehet vonni annak javítására.

(Egy kis megjegyzés hozzáadása: Ez a bejegyzés csak a WordPress telepítéséhez hasznos, csak egy domain vagy aldomain gyökérkönyvtárában, pl. Domain.com vagy példa.domain.com.)

Pontosan hol van a WordPress robots.txt fájl?

Alapértelmezés szerint a WordPress virtuális robots.txt fájlt generál. A telepítés /robots.txt webhelyen láthatja, például:

https://yoursite.com/robots.txt

Ez az alapértelmezett fájl csak a memóriában létezik, és a kiszolgálón nem ábrázolja.

Ha egyedi robots.txt fájlt szeretne használni, akkor csak annyit kell tennie, hogy feltölt egy telepítés gyökérmappájába.

Ezt megteheti FTP alkalmazás vagy plugin, például a Yoast SEO (SEO → Eszközök → Fájlszerkesztő), amely tartalmaz egy robot.txt szerkesztőt, amelyhez hozzáférhet a WordPress admin területén.

Az alapértelmezett WordPress robots.txt (és miért nem elég)

Ha nem hoz létre manuálisan robot.txt fájlt, akkor a WordPress ‘alapértelmezett kimenet így néz ki:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Bár ez biztonságos, ez nem optimális. Menjünk tovább.

Mindig adja meg az XML webhelytérképét

Győződjön meg arról, hogy az összes XML webhelytérképet kifejezetten felsorolják, mivel ez segít a keresőmotoroknak az összes releváns URL felfedezésében.

Sitemap: https://example.com/sitemap_index.xml
Sitemap: https://example.com/sitemap2.xml

Néhány dolog, amit nem lehet blokkolni

Jelenleg keltezett javaslatok vannak arra, hogy tiltsák meg néhány alapvető WordPress könyvtárat, például a/WP-beleértve/,/wp-content/plugins/, vagy akár/wp-content/feltöltés/. Ne!

Ezért nem szabad blokkolni őket:

  1. A Google elég okos ahhoz, hogy figyelmen kívül hagyja a irreleváns fájlokat. A CSS és a JavaScript blokkolása károsíthatja a megjeleníthetőséget és indexelési problémákat okozhat.
  2. Nem szándékosan blokkolhatja az értékes képeket/videókat/egyéb adathordozókat, különösen a/WP-Content/Uploads/-ból betöltött médiumokat, amelyek tartalmazzák az összes feltöltött médiát, amelyet feltétlenül szeretnének mászni.

Ehelyett hagyja, hogy a rugók a CSS -t, a JavaScriptet és a megfelelő megjelenítéshez szükséges képeket kapják.

Átmeneti helyek kezelése

Javasoljuk annak biztosítása, hogy a rendező helyek nem másznak -e mind SEO, mind általános biztonsági célokra.

Mindig azt tanácsolom, hogy engedje el az egész webhelyet.

Még mindig használja a NoIndex Meta címkét, de annak biztosítása érdekében, hogy egy másik réteg lefedje, továbbra is tanácsos mindkettőt megtenni.

Ha navigálsz Beállítások> OlvasásJelölheti a „Keresőmotorok visszatartása a webhely indexelésétől” lehetőséget, amely a következőket teszi a robots.txt fájlban (vagy ezt hozzáadhatja önmagában).

User-agent: *
Disallow: /

A Google továbbra is indexelheti az oldalakat, ha másutt felfedezi a linkeket (általában a termelésből származó színpadi hívások okozzák, amikor a migráció nem tökéletes).

Fontos: Amikor a termelésre költözik, ügyeljen arra, hogy újra ellenőrizze ezt a beállítást, hogy megbizonyosodjon arról, hogy visszaállítja a tiltást vagy a noindexing-et.

Tisztítsa meg néhány nem alapvető Core WordPress utat

Nem mindent el kell blokkolni, de sok alapértelmezett útvonal nem ad hozzá SEO -értéket, például az alábbiak:

Disallow: /trackback/
Disallow: /comments/feed/
Disallow: */embed/
Disallow: /cgi-bin/
Disallow: /wp-login.php

Tiltja meg a konkrét lekérdezési paramétereket

Időnként meg kell állítania a keresőmotorokat az ismert, alacsony értékű lekérdezési paraméterekkel, mint például a nyomkövetési paraméterek, a megjegyzésválaszok vagy a nyomtatási verziók nyomkövetése.

Íme egy példa:

User-agent: *
Disallow: /*?*replytocom=
Disallow: /*?*print=

Használhatja a Google Search Console URL-paraméterek eszközét a paraméter-vezérelt indexelési minták megfigyelésére, és eldöntheti, hogy a további tilalmak méltóak-e a hozzáadásra.

Az alacsony értékű taxonómiák és a SERP-k tiltása

Ha a WordPress webhelye tartalmazza a Tag -archívumokat vagy a belső keresési eredményeket, amelyek nem adnak hozzáadott értéket, akkor is blokkolhatja őket:

User-agent: *
Disallow: /tag/
Disallow: /page/
Disallow: /?s=

Mint mindig, mérlegelje ezt az adott tartalmi stratégiájával.

Ha a Tag taxonómia oldalakat használja a tartalom részeként, indexelt és mászni szeretne, akkor hagyja figyelmen kívül ezt, de általában nem ad hozzá előnyeit.

Ezenkívül győződjön meg arról, hogy a belső összekötő struktúra támogatja -e döntését, és minimalizálja a belső kapcsolatokat olyan területekkel, amelyekben nem szándékozik indexelni vagy mászni.

Figyelje a feltérképezés statisztikáit

Miután a robotok.txt a helyén van, figyelje a feltérképezés statisztikáit a Google Search Console -on:

  • Nézze meg a feltérképezés statisztikáit a beállítások alatt, hogy megnézze, vajon a robotok pazarolják -e az erőforrásokat.
  • Használja az URL -ellenőrző eszközt annak megerősítéséhez, hogy a blokkolt URL indexel -e vagy sem.
  • Ellenőrizze a webhelytérképeket, és győződjön meg arról, hogy csak a mászás és az indexelt oldalak referencia oldalaikat.

Ezenkívül néhány szerverkezelő eszköz, például a Plesk, a CPanel és a CloudFlare, rendkívül részletes feltérképezési statisztikákat nyújthat a Google -on.

Végül használja a Screaming Frog konfigurációjának felülbírálását a változások szimulálásához és a Yoast SEO feltérképezésének optimalizálási funkcióinak újraértékeléséhez, amelyek közül néhány megoldja a fentieket.

Végső gondolatok

Noha a WordPress nagyszerű CMS, nem állítja be a legideálisabb alapértelmezett robots.txt -et, vagy nem állítja be a feltérképezés optimalizálását.

Mindössze néhány sor kód és kevesebb, mint 30 perc ideje több ezer szükségtelen feltérképezési kérelmet takaríthat meg a webhelyére, amelyek egyáltalán nem érdemesek azonosítani, és a jövőben potenciális méretezési kérdés biztosítása.


A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.