A Google elmagyarázza, hogyan hatnak a CDN-ek a feltérképezésre és a SEO-ra

Peter

A Google közzétett egy magyarázatot, amely azt tárgyalja, hogy a tartalomszolgáltató hálózatok (CDN-ek) hogyan befolyásolják a keresési feltérképezést és javítják a SEO-t, de azt is, hogyan okozhatnak néha problémákat.

Mi az a CDN?

A Content Delivery Network (CDN) egy olyan szolgáltatás, amely gyorsítótáraz egy weboldalt, és egy olyan adatközpontból jeleníti meg, amely a legközelebb van az adott weboldalt kérő böngészőhöz. Egy weboldal gyorsítótárazása azt jelenti, hogy a CDN másolatot készít egy weboldalról, és eltárolja azt. Ez felgyorsítja a weboldalak kézbesítését, mivel most egy olyan szerverről szolgálják ki, amely közelebb van a webhely látogatójához, és kevesebb „ugrást” igényel az interneten a kiindulási szervertől a célállomásig (a webhely látogatójának böngészője).

A CDN-k további feltérképezést tesznek lehetővé

A CDN használatának egyik előnye, hogy a Google automatikusan növeli a feltérképezési sebességet, ha azt észleli, hogy a weboldalakat egy CDN-ről szolgálják ki. Ez vonzóvá teszi a CDN használatát a keresőoptimalizálók és a megjelenítők számára, akik aggódnak a Googlebot által feltérképezett oldalak számának növelése miatt.

Általában a Googlebot csökkenti a szerverről érkező feltérképezések számát, ha azt észleli, hogy az elér egy bizonyos küszöböt, ami a szerver lelassulását okozza. A Googlebot lelassítja a feltérképezés mértékét, amit fojtásnak neveznek. A „szabályozás” küszöbértéke magasabb, ha a rendszer CDN-t észlel, ami több oldal feltérképezését eredményezi.

Az oldalak CDN-ről történő kiszolgálásával kapcsolatban meg kell érteni, hogy az oldalak első kiszolgálásakor közvetlenül a szerverről kell kiszolgálni. A Google egy több mint millió weboldalt tartalmazó webhely példáját használja:

„Azonban az URL első elérésekor a CDN gyorsítótára „hideg”, ami azt jelenti, hogy mivel még senki nem kérte ezt az URL-t, a tartalmát a CDN még nem gyorsítótárazta, így a kiindulási szervernek továbbra is ki kell szolgáltatnia ezt az URL-t. legalább egyszer, hogy „felmelegítse” a CDN gyorsítótárát. Ez nagyon hasonlít a HTTP-gyorsítótárazás működésére is.

Röviden, még akkor is, ha a webáruházat CDN támogatja, a szerverének legalább egyszer ki kell szolgálnia ezt az 1 000 007 URL-t. Csak a kezdeti kiszolgálás után tud a CDN segíteni a gyorsítótáraival. Ez jelentős terhet jelent a „feltérképezési költségkeretre”, és a feltérképezési arány valószínűleg magas lesz néhány napig; ezt tartsa szem előtt, ha több URL-t tervez egyszerre elindítani.”

CDN-ek használatakor a feltérképezés visszafelé gyújtása

A Google azt tanácsolja, hogy vannak esetek, amikor a CDN feketelistára teheti a Googlebotot, és ezt követően blokkolja a feltérképezést. Ezt a hatást kétféle blokkként írják le:

1. Kemény blokkok

2. Puha blokkok

Kemény blokkolások történnek, amikor a CDN azt válaszolja, hogy szerverhiba történt. A rossz szerverhiba-válasz lehet 500 (belső szerverhiba), ami azt jelzi, hogy komoly probléma történik a szerverrel. Egy másik rossz szerverhiba válasz az 502 (rossz átjáró). Mindkét szerverhiba-válasz hatására a Googlebot lelassítja a feltérképezési sebességet. Az indexelt URL-eket a Google belsőleg menti, de a folyamatos 500/502 válaszok miatt a Google végül kihagyhatja az URL-eket a keresési indexből.

Az előnyben részesített válasz az 503 (a szolgáltatás nem elérhető), ami átmeneti hibát jelez.

Egy másik kemény blokk, amire figyelni kell, az, amit a Google „véletlenszerű hibáknak” nevez, vagyis amikor a szerver 200-as válaszkódot küld, ami azt jelenti, hogy a válasz jó volt (annak ellenére, hogy hibaoldalt jelenít meg ezzel a 200-as válasszal). A Google ismétlődőként értelmezi ezeket a hibaoldalakat, és kidobja őket a keresési indexből. Ez nagy probléma, mert időbe telhet az ilyen jellegű hibák helyreállítása.

Lágy blokk történhet, ha a CDN az „Ember vagy?” előugró ablakok (bot közbeiktatott hirdetések) a Googlebot számára. A közbeiktatott robotoknak 503-as szerverválaszt kell küldeniük, hogy a Google tudja, hogy ez átmeneti probléma.

A Google új dokumentációja kifejti:

„…amikor megjelenik a közbeiktatott hirdetés, csak ezt látják, nem az Ön fantasztikus webhelyét. Ezen bot-ellenőrző közbeiktatott hirdetések esetében erősen javasoljuk, hogy küldjön egyértelmű jelzést egy 503-as HTTP-állapotkód formájában az automatizált ügyfeleknek, például a feltérképező robotoknak, hogy a tartalom átmenetileg nem érhető el. Ez biztosítja, hogy a tartalom ne kerüljön automatikusan eltávolításra a Google indexéből.”

Lásd még: 9 tipp a feltérképezési költségkeret optimalizálásához SEO-hoz

Hibakeresési problémák az URL-ellenőrző eszközzel és a WAF-vezérlőkkel

A Google azt javasolja, hogy használja a Search Console URL-ellenőrző eszközét, hogy megtudja, hogyan szolgálja ki a CDN az Ön weboldalait. Ha a CDN tűzfal, az úgynevezett Web Application Firewall (WAF), IP-cím alapján blokkolja a Googlebotot, akkor képesnek kell lennie arra, hogy ellenőrizze a blokkolt IP-címeket, és hasonlítsa össze őket a Google hivatalos IP-listájával, hogy megtudja, valamelyikük szerepel-e a listán. .

A Google a következő CDN-szintű hibakeresési tanácsokat kínálja:

„Ha arra van szüksége, hogy webhelye megjelenjen a keresőmotorokban, erősen javasoljuk, hogy ellenőrizze, hogy az Önt érdeklő robotok hozzáférhetnek-e webhelyéhez. Ne feledje, hogy az IP-címek automatikusan blokkollistára kerülhetnek, anélkül, hogy tudná, ezért érdemes időnként bejelentkezni a tiltólistára, hogy webhelye sikeres legyen a keresésben és azon túl is. Ha a tiltólista nagyon hosszú (nem ellentétben ezzel a blogbejegyzéssel), próbálja meg csak az IP-tartományok első néhány szegmensét keresni, például a 192.168.0.101 helyett csak a 192.168-at keresse.”

További információért olvassa el a Google dokumentációját:

December feltérképezése: CDN-ek és feltérképezés

A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.