A Google helyi munkatípus -algoritmusa a kutatási cikkben részletezett

Peter

A Google egy kutatási dokumentumot tett közzé, amelyben leírja, hogy miként vonja ki a „szolgáltatásokat kínált” információkat a helyi üzleti webhelyekről, hogy hozzáadja az üzleti profilokhoz a Google Maps és a Keresés. Az algoritmus leírja a konkrét releváns tényezőket, és megerősíti, hogy a rendszer egy éve sikeresen használható.

Különösen figyelemre méltóvá teszi ezt a kutatási dokumentumot, hogy az egyik szerző Marc Najork, a Google kiemelkedő kutató -tudósa, aki számos mérföldkövet társít az információmegkeresés, a természetes nyelvfeldolgozás és a mesterséges intelligencia területén.

Ennek a rendszernek az a célja, hogy megkönnyítse a felhasználók számára a helyi vállalkozások megtalálását, amelyek nyújtják a keresett szolgáltatásokat. A tanulmányt 2024 -ben tették közzé (az Internet Archívum szerint), és 2023 -ban kelt.

A kutatási cikk elmagyarázza:

„… A felhasználói erőfeszítések csökkentése érdekében egy csővezetéket fejlesztettünk ki és telepítettünk a munkatípusok automatikus kinyerésére az üzleti webhelyekről. Például, ha egy vízvezeték -vállalkozás tulajdonában lévő weboldal kimondja:„ WC -telepítést és csaptelepek javító szolgáltatást nyújtunk ”, a csővezeték kimenetele a WC -telepítést és a csaptelep javítását, mint az üzleti tevékenységek munkafajtait.”

A rendszer Bert -et használja

A Google a Bert nyelvmodellt használta annak osztályozására, hogy az üzleti webhelyekről kinyert mondatok leírják -e a tényleges állástípusokat. Bert-et finoman hangolták a címkézett példákon, és további kontextusokat kaptak, például a weboldal felépítését, az URL-mintákat és az üzleti kategóriát, hogy javítsák a pontosságot a méretezhetőség feláldozása nélkül.

Helyi keresési rendszer fejlesztése

A munkaköri információk mászásának és kinyerésének rendszerének létrehozásának első lépése a képzési adatok létrehozása a semmiből. Kiválasztottak milliárd otthoni oldalt, amelyeket a Google Business Profiles -ben felsorolnak, és a táblázatokból és a formázott listákból kinyertek a munkakör típusait, és az otthoni oldalakon vagy az otthoni oldalakon kívüli oldalakon voltak. Ez a munkatípus -adatok a munkakörök vetőmagkészletévé váltak.

A kinyert munkatípus adatait keresési lekérdezésekként használták, a lekérdezés bővítésével (szinonimák) kibővítve a munkatípusok listájának kibővítéséhez, hogy belefoglaljuk a munkakör típusa összes lehetséges variációját.

Második lépés: A relevancia probléma megoldása

A Google kutatói a milliárd oldalra alkalmazták rendszerüket, és ez nem működött úgy, hogy a szándék szerint, mert sok oldal olyan munkatípus -kifejezésekkel rendelkezik, amelyek nem írták le a kínált szolgáltatásokat.

A kutatási cikk elmagyarázza:

„Megállapítottuk, hogy sok oldal más célokra említi a munkakörök neveit, például az élet tippjeit. Például egy olyan weboldal, amely az olvasókat az ágyhibák kezelésére tanítja, tartalmazhat egy mondatot, mint egy megoldás, ha otthoni takarítási szolgáltatásokat hívnak, ha otthoni tisztító vállalkozás nem biztosítja az otthoni tisztítószereket.”

A mászás és az indexelés korlátozása a munkatípus -kulcsszó -mondatok azonosítására hamis pozitív eredményeket eredményezett. A megoldás az volt, hogy beépítsük azokat a mondatokat, amelyek körülvették a kulcsszó -mondatokat, hogy jobban megértsék a feladat típusú kulcsszó -mondatok kontextusát.

A környező szöveg használatának sikerét magyarázzuk:

„Amint a 2. táblázatban látható, a JobModelsurrounround lényegesen jobban teljesít, mint a JobModel, ami azt sugallja, hogy a környező szavak valóban megmagyarázhatják a vetőmag -munkavégzés szándékát.

SEO betekintés
A leírt helyi keresési algoritmus szándékosan kizárja az oldalon lévő összes információt, és nullázza a munkatípus kulcsszót mondatokat, valamint a környező szavakat és kifejezéseket a kulcsszavak körül. Ez megmutatja annak fontosságát, hogy a fontos kulcsszó -mondatok körüli szavak hogyan tudnak kontextust biztosítani a kulcsszó -kifejezésekhez, és megkönnyíthetik a Google feltérképezőit, hogy megértsék, miről szól az oldal, anélkül, hogy a teljes weboldalt fel kellene dolgoznia.

SEO betekintés
Egy másik betekintés az, hogy a Google nem indexálja a teljes weboldalt a munkakör típusa kulcsszó -mondatok azonosításának korlátozott céljából. Az algoritmus a kulcsszó -mondat és a környező kulcsszó -mondatok vadászata.

SEO betekintés
Az oldal csak egy részének elemzésének fogalma hasonló a Google középpontjába, ahol egy tartalomszakaszot azonosítanak az oldal fő témájaként. Nem azt mondom, hogy ezek rokonok. Csak rámutatom egy olyan funkcióra, amelyben a Google algoritmus nullázza az oldal csak egy szakaszában.

Az extrakciós rendszer más kontextusokra általánosítható

A kutatási cikk által részletes érdekes megállapítás az, hogy az általuk kifejlesztett rendszer felhasználható a helyi vállalkozásokon kívüli területeken (területeken), például „szakértelemkeresés, jogi és orvosi információk kinyerése”.

Írnak:

„Azok a leckék, amelyeket megosztottunk a nagyméretű extraháló csővezeték fejlesztésében a semmiből, általánosíthatók más információk kinyerésére vagy gépi tanulási feladatokra. Közvetlen alkalmazásokkal rendelkeznek a domain-specifikus kitermelési feladatokhoz, amelyeket a szakértelem, a jogi és az orvosi információk kinyerése szemléltet.

Három legfontosabb lecke:

(1) Az adattulajdonságok, például a strukturált tartalom felhasználása enyhítheti az adat kommentárának hidegindítási problémáját;

(2) a feladat visszakeresési problémaként történő megfogalmazása segíthet a kutatóknak és a szakembereknek egy nagy adatkészlet kezelésében;

(3) A kontextusinformációk javíthatják a modell minőségét anélkül, hogy feláldoznák annak méretezhetőségét. ”

A munkatípus -kivonat sikeres

A kutatási cikk azt mondja, hogy rendszerük sikeres, magas pontossággal (pontossággal) rendelkezik, és méretezhető. A kutatási cikk szerint egy éve már használatban van. A kutatás 2023 -ban kelt, de az Internet Archívum (Wayback Machine) szerint valamikor 2024 júliusában jelent meg.

A kutatók írják:

„A csővezetékünket rendszeresen hajtjuk végre, hogy a kivonott tartalmat naprakészen tartsák. Jelenleg a termelésben telepítik, és a kimeneti munkatípusokat a Google-keresés és a MAPS felhasználók millióinak millióinak látják el.”

Elvitel

  • A Google algoritmusa, amely a munkatípusokat kivonja a weboldalakról
    A Google kifejlesztett egy algoritmust, amely kivonja a „Jobtípusokat” (azaz a kínált szolgáltatásokat) az üzleti webhelyekről, hogy megjelenítse a Google Maps -ban és a Keresésben.
  • Csővezeték kivonatok a strukturálatlan tartalomból
    Ahelyett, hogy a strukturált HTML elemekre támaszkodna, az algoritmus a szabad szöveg tartalmát olvassa, még akkor is, ha a szolgáltatásokat bekezdésekbe temették el.
  • A kontextuális relevancia fontos
    A rendszer kiértékeli a környező szavakat, hogy megerősítse, hogy a szolgáltatáshoz kapcsolódó kifejezések valóban relevánsak az üzleti életben, javítva a pontosságot.
  • Modell általánosítási potenciál
    A megközelítés alkalmazható más területeken, például a jogi vagy orvosi információk kitermelésére, megmutatva, hogyan lehet alkalmazni más típusú ismeretekre.
  • Nagy pontosság és méretezhetőség
    A rendszert több mint egy éve telepítik, és méretezhető, nagy pontosságú eredményeket eredményeznek milliárd weboldalon.

A Google kutatási cikket tett közzé egy algoritmusról, amely automatikusan kibontja a szolgáltatási leírásokat a helyi üzleti webhelyekről a kulcsszó-mondatok és a környező kontextus elemzésével, lehetővé téve a pontosabb és naprakész listákat a Google Maps és a Search oldalon. Ez a technika elkerüli a HTML szerkezetétől való függőséget, és más iparágakban történő felhasználásra adaptálható, ahol a nem strukturált szövegből származó információkra van szükség.

Olvassa el a kutatási papírt absztrakt, és töltse le a PDF verziót itt:

Munka típusú extrakció a szolgáltató vállalkozások számára

A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.