A Google Ads új mesterséges intelligencia-modellt használ a csaló hirdetők elkapására

Peter

A Google közzétett egy kutatási tanulmányt a Google Ads rendszerben előforduló csalások kimutatására szolgáló új mesterséges intelligencia-modellről, amely jelentős előrelépés a korábban használthoz képest. Az érdekes az, hogy a 2025. december 31-i kutatási cikk szerint az új mesterséges intelligencia bevezetésre került, ami több mint 40 százalékponttal javult az észlelési arányban, és 99,8%-os pontosságot ér el az egyes irányelvek esetében.

ALF: Advertiser Large Foundation Model

Az új mesterséges intelligencia neve ALF (Advertiser Large Foundation Model), amelynek részleteit 2025. december 31-én tették közzé. Az ALF egy multimodális nagy alapmodell, amely szövegeket, képeket és videókat elemzi olyan tényezőkkel együtt, mint a fiók életkora, a számlázási adatok és a korábbi teljesítménymutatók.

A kutatók kifejtik, hogy e tényezők közül sok külön-külön nem jelöli meg a fiókot potenciálisan problémásként, de ezeknek a tényezőknek az összehasonlítása jobban megérti a hirdetői magatartást és szándékot.

Azt írják:

„Ebben az ökoszisztémában az egyik fő kihívás a hirdetők szándékának és viselkedésének pontos és hatékony megértése. Ez a megértés kritikus fontosságú számos kulcsfontosságú alkalmazás esetében, beleértve a felhasználók hirdetésekkel való egyeztetését, valamint a csalások és irányelvsértések azonosítását.

Ennek a kihívásnak a megoldása holisztikus megközelítést igényel, különféle adattípusok feldolgozását, beleértve a strukturált fiókinformációkat (pl. a fiók kora, a számlázási adatok), a multimodális hirdetési elemeket (szöveg, képek, videók) és a céloldal tartalmát.

Például egy hirdetőnek van nemrégiben létrehozott fiókja, szöveges és képes hirdetései vannak egy jól ismert nagy márkához, és egyszer elutasították a hitelkártyás fizetését. Bár mindegyik elem ártatlanul létezhet elszigetelten, a kombináció erősen csalárd műveletre utal.”

A kutatók három olyan kihívással foglalkoznak, amelyeket a korábbi rendszerek nem tudtak leküzdeni:

1. Heterogén és nagydimenziós adatok
A heterogén adatok arra utalnak, hogy a hirdetői adatok több formátumban is megjelennek, nem csak egy típusban. Ez magában foglalja a strukturált adatokat, például a fiók életkorát és a számlázási típust, valamint a strukturálatlan adatokat, például a kreatív elemeket, például a képeket, szöveget és videót. A nagydimenziós adatok az egyes hirdetőkhöz társított több száz vagy több ezer adatpontra utalnak, amelyek mindegyikének matematikai ábrázolása nagydimenzióssá válik, ami kihívást jelent a hagyományos modellek számára.

2. A kreatív eszközök korlátlan készletei
A hirdetők több ezer kreatív elemmel, például képekkel rendelkezhetnek, és egy-két rosszindulatú elemet rejthetnek el több ezer ártatlan eszköz között. Ez a forgatókönyv túlszárnyalta az előző rendszert.

3. Valós megbízhatóság és megbízhatóság
A rendszernek képesnek kell lennie arra, hogy megbízható megbízhatósági pontszámokat generáljon arra vonatkozóan, hogy egy vállalkozás rosszindulatú szándékkal rendelkezik, mert egy téves pozitív eredmény egyébként egy ártatlan hirdetőt érintene. El kell várni, hogy a rendszer működjön anélkül, hogy folyamatosan újra kellene hangolnia, hogy elkapja a hibákat.

Adatvédelem és biztonság

Bár az ALF elemzi az olyan érzékeny jeleket, mint a számlázási előzmények és a fiókadatok, a kutatók hangsúlyozzák, hogy a rendszert szigorú adatvédelmi biztosítékokkal tervezték. Mielőtt a mesterséges intelligencia bármilyen adatot feldolgozna, minden személyazonosításra alkalmas információt (PII) töröl. Ez biztosítja, hogy a modell a kockázatokat magatartási minták alapján azonosítsa, nem pedig érzékeny személyes adatok alapján.

A titkos szósz: Hogyan észleli a kiugró értékeket

A modell az „Inter-Sample Attention” nevű technikát is alkalmazza, hogy javítsa észlelési készségeit. Ahelyett, hogy egyetlen hirdetőt vákuumban elemezne, az ALF „nagy hirdetői kötegeket” vizsgál, hogy összehasonlítsa interakcióikat egymással. Ez lehetővé teszi a mesterséges intelligencia számára, hogy megtanulja, hogyan néz ki a normál tevékenység az egész ökoszisztémában, és pontosabbá teheti a gyanús kiugró jelenségek észlelését, amelyek nem illeszkednek a normál viselkedésbe.

Az Alf felülmúlja a termelési referenciaértékeket

A kutatók kifejtik, hogy tesztjeik azt mutatják, hogy az ALF felülmúlja az erősen hangolt termelési alapvonalat:

„Kísérleteink azt mutatják, hogy az ALF jelentősen felülmúlja az erősen hangolt gyártási alapvonalat, miközben a nyilvános benchmarkokon is erőteljesen teljesít. A gyártás során az ALF jelentős és egyidejűleg növeli a pontosságot és a visszahívást, több mint 40 százalékponttal növelve a visszahívást az egyik kritikus politikánál, míg a pontosságot 99,8%-ra növeli a másiknál.”

Ez az eredmény azt mutatja, hogy az ALF több értékelési kritérium alapján is mérhető nyereséget tud elérni valós, valós termelési körülmények között, nem csak offline vagy benchmark környezetekben.

Máshol említenek kompromisszumokat a sebességben:

„Ennek a megközelítésnek a hatékonyságát egy rendkívül erős gyártási alapvonalon igazolták, amely maga a különféle architektúrák és hiperparaméterek kiterjedt keresésének eredménye, beleértve a DNN-eket, az együtteseket, a GBDT-ket és a logisztikai regressziót a funkciók keresztezésével.

Míg az ALF késleltetése magasabb a nagyobb modellméret miatt, jóval a termelési környezetünkben elfogadható tartományon belül marad, és hardveres gyorsítókkal tovább optimalizálható. A kísérletek azt mutatják, hogy az ALF jelentősen felülmúlja az alapszintet a kulcsfontosságú kockázatészlelési feladatokban, a teljesítménynövekedést a tartalombeágyazások holisztikus modellezésének egyedülálló képessége okozza, amelyet az egyszerűbb architektúrák nehezen tudtak kihasználni. Ezt a kompromisszumot a sikeres telepítés indokolja, ahol az ALF naponta több millió kérést szolgál ki.”

A késleltetés arra az időre vonatkozik, amely alatt a rendszer választ ad egy kérés beérkezése után, és a kutatói adatok azt mutatják, hogy bár az ALF növeli ezt a válaszidőt az alapvonalhoz képest, a várakozási idő elfogadható marad az éles használatra, és már nagy méretekben működik, miközben lényegesen jobb csalásészlelési teljesítményt nyújt.

Továbbfejlesztett csalásfelderítés

A kutatók azt mondják, hogy az ALF-et a Google Ads biztonsági rendszerében alkalmazzák a Google Ads irányelveit megsértő hirdetők azonosítására. Nincs arra utaló jel, hogy a rendszert máshol is használnák, például a Keresésben vagy a Google vállalkozásprofilokban. De azt mondták, hogy a jövőbeni munka az időalapú tényezőkre („időbeli dinamikára”) összpontosíthat a fejlődő minták megragadásához. Azt is jelezték, hogy hasznos lehet a közönségmodellezés és a kreatív optimalizálás szempontjából.

Olvassa el a kutatás eredeti PDF-változatát:

ALF: Advertiser Large Foundation Model for Multi-Modal Advertiser Understanding

A szerzőről

Peter, az eOldal.hu tapasztalt SEO szakértője és tartalomgyártója. Több mint 10 éve foglalkozik keresőoptimalizálással és online marketinggel, amelyek révén számos magyar vállalkozás sikerét segítette elő. Cikkeiben részletes és naprakész információkat nyújt az olvasóknak a legfrissebb SEO trendekről és stratégiákról.