Hogyan működhetnek az olyan ajánlórendszerek, mint a Google Discover

A Google Discover nagyrészt rejtély a kiadók és a keresőmarketing-közösség számára, annak ellenére, hogy a Google hivatalos útmutatást tett közzé arról, hogy mi az, és szerintük mit kell tudniuk róla a kiadóknak. Ennek ellenére annyira titokzatos, hogy általában nem is tekintik ajánlórendszernek, mégis ez az. Ez egy klasszikus kutatási tanulmány áttekintése, amely bemutatja, hogyan lehet méretezni egy ajánlórendszert. Bár a YouTube-ra való, nem nehéz elképzelni, hogyan illeszthető ez a fajta rendszer a Google Discoverhez.

Recommender Systems

A Google Discover az ajánlórendszerekként ismert rendszerek osztályába tartozik. Emlékszem, hogy egy klasszikus ajánlórendszer a MovieLens rendszer 1997-ből. Ez egy egyetemi tudományos tanszéki projekt, amely lehetővé tette a felhasználók számára, hogy értékeljék a filmeket, és ezeket az értékeléseket használják filmek megtekintésére. Úgy működik, hogy azok, akik általában szeretik az ilyen típusú filmeket, általában szeretik az ilyen típusú filmeket is. Az ilyen típusú algoritmusoknak azonban vannak korlátai, amelyek miatt nem érik el azt a mértéket, amely a YouTube vagy a Google Discover számára történő ajánlások személyre szabásához szükséges.

Kéttornyos ajánlórendszer modell

A modern stílusú ajánlórendszereket néha Two-Tower architektúrának vagy kéttorony modellnek is nevezik. A Two-Tower modell megoldásként jelent meg a YouTube számára, bár az eredeti kutatási cikk (Deep Neural Networks for YouTube Recommendations) nem használja ezt a kifejezést.

Ellentétesnek tűnik a YouTube-ra nézni, hogy megértse a Google Discover algoritmus működését, de tény, hogy a Google YouTube számára kifejlesztett rendszere lett az alapja annak, hogyan méretezhető az ajánlórendszer olyan környezetben, ahol a nap 24 órájában hatalmas mennyiségű tartalom generálódik a nap minden órájában.

Kéttorony architektúrának hívják, mert két olyan ábrázolás van, amelyek egymáshoz illeszkednek, mint két torony.

Ebben a modellben, amely a tartalom kezdeti „lekérését” kezeli az adatbázisból, egy neurális hálózat feldolgozza a felhasználói információkat, hogy felhasználói beágyazást hozzon létre, míg a tartalomelemeket saját beágyazásuk reprezentálja. Ezt a két reprezentációt hasonlósági pontozással egyeztetik, nem pedig egyetlen hálózaton belül.

Megismétlem, hogy a kutatási cikk nem kéttornyos architektúraként említi az építészetet, ez egy leírás egy későbbi megközelítéshez. Tehát bár a kutatási cikk nem használja a torony szót, továbbra is ezt fogom használni, mert így könnyebben láthatóvá válik, mi történik ebben a fajta ajánlórendszerben.

Felhasználói torony
A User Tower olyan dolgokat dolgoz fel, mint a felhasználó megtekintési előzményei, keresési tokenjei, helye és alapvető demográfiai adatai. Ezen adatok felhasználásával olyan vektoros ábrázolást hoz létre, amely leképezi a felhasználó konkrét érdeklődési körét egy matematikai térben.

Tétel Torony
Az elemtorony tanult beágyazási vektorok segítségével jeleníti meg a tartalmat. Az eredeti YouTube-megvalósításban ezeket a felhasználói modell mellett képezték ki, és tárolták a gyors visszakeresés érdekében. Ez lehetővé teszi a rendszer számára, hogy azonnal összehasonlítsa a felhasználó „koordinátáit” több millió videó „koordinátájával”, anélkül, hogy minden egyes videón komplex elemzést kellene futtatnia, amikor frissíti a hírcsatornát.

A friss tartalom probléma

A Google kutatási cikke érdekes képet ad a frissességről. A frissesség problémáját a kiaknázás és a feltárás közötti kompromisszumként írják le. A YouTube ajánlási rendszerének egyensúlyt kell teremtenie aközött, hogy a felhasználóknak olyan tartalmakat jelenítsen meg, amelyekről már ismert, hogy népszerűek (kizsákmányolás), illetve az új és nem bizonyított tartalomnak való kitétel (felfedezés) között. Ami motiválja a Google-t arra, hogy új, de nem bizonyított tartalmakat mutasson, legalábbis a YouTube kontextusában, az az, hogy a felhasználók erősen preferálják az új és friss tartalmakat.

A tanulmány elmagyarázza, miért fontos a friss tartalom:

„Sok órányi videót töltenek fel másodpercenként a YouTube-ra. A nemrég feltöltött („friss”) tartalom ajánlása rendkívül fontos a YouTube, mint termék számára. Folyamatosan megfigyeljük, hogy a felhasználók a friss tartalmakat részesítik előnyben, bár nem a relevancia rovására.”

Úgy tűnik, hogy ez a tendencia a friss tartalom megjelenítésére igaz a Google Discoverre, ahol a Google hajlamos friss tartalmat megjeleníteni olyan témákban, amelyekkel a felhasználók személyesen felkapaszkodnak. Észrevette már, hogy a Google Discover a friss tartalmakat részesíti előnyben? A kutatók felhasználói preferenciáival kapcsolatos meglátásai valószínűleg átkerülnek a Google Discover ajánlási rendszerébe. A lényeg az, hogy a rendszeres tartalomkészítés hasznos lehet ahhoz, hogy weboldalak megjelenjenek a Google Discoverben.

Érdekes meglátás ebben a kutatási cikkben, és nem tudom, hogy még mindig igaz-e, de még mindig érdekes, hogy a kutatók azt állítják, hogy a gépi tanulási algoritmusok implicit torzítást mutatnak a régebbi, létező tartalom felé, mivel történeti adatokra képezték ki őket.

Elmagyarázzák:

„A gépi tanulási rendszerek gyakran implicit elfogultságot mutatnak a múlt felé, mert arra tanítják őket, hogy történelmi példák alapján megjósolják a jövőbeli viselkedést.”

A neurális hálózatot a múltbeli videókon képezik ki, és megtanulják, hogy az egy-két nappal ezelőtti dolgok népszerűek voltak. Ez azonban elfogultságot teremt a múltban történt dolgokhoz. A frissesség problémáját úgy oldották meg, amikor a rendszer videókat ajánl a felhasználónak (kiszolgálás), ez az időalapú funkció nulla napja van beállítva (vagy enyhén negatív). Ez azt jelzi a modellnek, hogy a képzési ablak legvégén tesz jóslatot, lényegében arra kényszerítve, hogy megjósolja, mi a népszerű jelenleg, nem pedig az, hogy mi volt átlagosan népszerű a múltban.

A kattintási adatok pontossága

A Google alapozó kutatási dokumentuma betekintést nyújt az implicit felhasználói visszajelzésekre is, amelyek hivatkozási adatok a kattintási adatokra. A kutatók azt mondják, hogy az ilyen típusú adatok ritkán nyújtanak pontos információt a felhasználói elégedettségről.

A kutatók ezt írják:

„Zaj: A felhasználók korábbi viselkedését a YouTube-on eleve nehéz megjósolni a ritkaság és a különféle nem megfigyelhető külső tényezők miatt. Ritkán ismerjük meg a felhasználói elégedettség alapigazságát, ehelyett zajos implicit visszacsatolási jeleket modellezünk. Ezenkívül a tartalomhoz kapcsolódó metaadatok rosszul strukturáltak, jól definiált ontológia nélkül. Algoritmusainkhoz szükség van
hogy robusztusak legyünk edzési adataink ezen sajátos jellemzőihez.”

A kutatók azzal zárják a tanulmányt, hogy kijelentik, hogy az ajánlórendszerek ilyen megközelítése segített megnövelni a felhasználói nézési időt, és hatékonyabbnak bizonyult, mint más rendszerek.

Azt írják:

„Leírtuk mély neurális hálózati architektúránkat a YouTube-videók ajánlásához, két különálló problémára bontva: a jelöltek generálására és a rangsorolásra.
Mélyen együttműködő szűrési modellünk képes hatékonyan asszimilálni számos jelet, és modellezni azok interakcióját a mélységi rétegekkel, felülmúlva a YouTube-on használt korábbi mátrixfaktorizációs megközelítéseket.

Bebizonyítottuk, hogy a képzési példa életkorának beviteli funkcióként való használata eltávolítja a múlt iránti belső torzítást, és lehetővé teszi, hogy a modell megjelenítse a népszerű videók időfüggő viselkedését. Ez javította az offline kitartás pontos eredményeit, és drámaian megnövelte a nézési időt az A/B tesztelés során nemrég feltöltött videóknál.

A rangsorolás klasszikusabb gépi tanulási probléma, de a mélytanulási megközelítésünk felülmúlta a korábbi lineáris és faalapú módszereket a nézési idő előrejelzésére. Különösen az ajánlórendszerek profitálnak a speciális funkciókból, amelyek leírják a múltbeli felhasználói viselkedést a tételekkel. A mély neurális hálózatok speciális reprezentációkat igényelnek a kategorikus és folytonos jellemzőkről, amelyeket beágyazásokkal, illetve kvantilis normalizálással alakítunk át.

Noha ez a kutatási cikk tíz éves, még mindig betekintést nyújt az ajánlórendszerek működésébe, és egy kicsit kiadja az olyan ajánlórendszerek rejtélyét, mint a Google Discover. Olvassa el az eredeti kutatási cikket: Deep Neural Networks for YouTube Recommendations