A Reddit beperelte a Perplexity-t és három adatkaparó céget a New York-i szövetségi bíróságon, azt állítva, hogy a cégek megkerülték a hozzáférés-szabályozást, hogy nagy léptékű Reddit-tartalomhoz jussanak, többek között a Google keresési eredményeinek lekaparásával.
A Perplexity nyilvános választ tett közzé, mondván, hogy idézetekkel foglalja össze a Reddit-beszélgetéseket, és nem képez AI-modelleket a Reddit-tartalomra.
Az álláspont összhangban van a társaság korábbi nyilatkozataival. Az továbbra is nyitott kérdés, hogy foglalkozik-e a Reddit bejelentésében szereplő konkrét állításokkal.
A panasz az Oxylabs UAB-t, az AWMProxyt és a SerpApi-t nevezi meg közvetítőként. Azt állítja, hogy a Perplexity a SerpApi ügyfele, és SerpApi-szolgáltatásokat vásárolt és/vagy használt a vezérlők megkerülésére és a Reddit-adatok másolására.
Bizonyítékok a panaszban
A perplexity érvelése egy technikai megkülönböztetésre épül. A vállalat azt állítja, hogy a Reddit-bejegyzésekről szóló megbeszéléseket összegzi és idézi, nem pedig képzési modelleket.
A Perplexity a Reddit válaszában ezt írta:
„Összefoglaljuk a Reddit-beszélgetéseket, és a válaszokban a Reddit-szálakat idézzük, ahogyan az emberek állandóan megosztanak itt bejegyzésekre mutató linkeket.”
A panasz azonban olyan technikai állításokat tartalmaz, amelyek megkérdőjelezik ezt a keretet.
A bejelentés szerint a Reddit tesztbejegyzést készített, amelyet csak a Google keresője tudott feltérképezni, és az interneten máshol nem volt elérhető. Órákon belül ez a rejtett tartalom megjelent a Perplexity találatai között.
A beadványban az is szerepel, hogy miután a Reddit felmondó levelet küldött, a Perplexity által a Redditnek küldött idézetek száma nagyjából negyvenszeresére nőtt.
Hasonló vádak a kiadóktól
A Forbes korábban egy exkluzív és fenyegetett jogi lépés újbóli közzétételével vádolta Perplexity-t.
A Wired arról számolt be, hogy a Perplexity nyilvánosságra nem hozott IP-címeket és hamisított felhasználói ügynök karakterláncokat használt a robots.txt megkerülésére. Vezetékes
A Cloudflare később azt mondta, hogy a Perplexity „lopakodó, nem deklarált bejárókat” használt, amelyek figyelmen kívül hagyták a feltérképezés tilalmát, az augusztusi tesztek alapján.
Hogyan reagált a zavarodottság
A korábbi vitákban a Perplexity azt mondta, hogy a problémák az új termékek durva éleiből fakadtak, és egyértelműbb hozzárendelést ígért.
A vállalat azzal is érvelt, hogy egyes médiaszervezetek megpróbálják ellenőrizni a „nyilvánosan közölt tényeket”.
Ebben a legutóbbi válaszában a Perplexity a Reddit keresetét a szélesebb körű képzési adatokkal kapcsolatos tárgyalások eszközeként fogalmazza meg, és ezt írja:
„Összefoglaljuk a Reddit-beszélgetéseket… Nem zsarolnak ki bennünket, és nem segítünk a Redditnek abban, hogy kizsarolja a Google-t.”
Miért számít ez?
Ez a probléma azért fontos, mert arról van szó, hogy az AI-asszisztensek hogyan használják fel a közönség által olvasott és a kiadók által gyakran hivatkozott fórumtartalmakat.
A jogi kérdések túlmutatnak a képzésen.
A bíróságok megvizsgálhatják, hogy megkerülték-e a technikai ellenőrzéseket, hogy az összefoglalás sérti-e a védett kifejezéseket, és hogy a harmadik féltől származó kaparók használata jogi felelősséghez vezethet-e a downstream termékekért.
Ha a bíróságok elfogadják a Reddit kijátszásellenes érvelését, az megváltoztathatja azt, ahogyan az asszisztensek idézik vagy kapcsolják össze a Reddit-szálakat.
Másrészről, ha a bíróságok egyetértenek Perplexity álláspontjával, az asszisztensek inkább a fórumon folyó vitákra hagyatkozhatnak, amelyeket kevésbé korlátoz az engedélyezés.
Amit még nem tudunk
A beadvány azt állítja, hogy a Perplexity legalább egy kaparócégen keresztül szerezte be az adatokat, de a nyilvános panasz nem határozza meg, hogy melyik szállító milyen adatokat szolgáltatott, és nem tartalmazza a tranzakció részleteit.
