A Perplexity reagál a Reddit adathozzáférés miatti perére

A Reddit beperelte a Perplexity-t és három adatkaparó céget a New York-i szövetségi bíróságon, azt állítva, hogy a cégek megkerülték a hozzáférés-szabályozást, hogy nagy léptékű Reddit-tartalomhoz jussanak, többek között a Google keresési eredményeinek lekaparásával.

A Perplexity nyilvános választ tett közzé, mondván, hogy idézetekkel foglalja össze a Reddit-beszélgetéseket, és nem képez AI-modelleket a Reddit-tartalomra.

Az álláspont összhangban van a társaság korábbi nyilatkozataival. Az továbbra is nyitott kérdés, hogy foglalkozik-e a Reddit bejelentésében szereplő konkrét állításokkal.

A panasz az Oxylabs UAB-t, az AWMProxyt és a SerpApi-t nevezi meg közvetítőként. Azt állítja, hogy a Perplexity a SerpApi ügyfele, és SerpApi-szolgáltatásokat vásárolt és/vagy használt a vezérlők megkerülésére és a Reddit-adatok másolására.

Bizonyítékok a panaszban

A perplexity érvelése egy technikai megkülönböztetésre épül. A vállalat azt állítja, hogy a Reddit-bejegyzésekről szóló megbeszéléseket összegzi és idézi, nem pedig képzési modelleket.

A Perplexity a Reddit válaszában ezt írta:

„Összefoglaljuk a Reddit-beszélgetéseket, és a válaszokban a Reddit-szálakat idézzük, ahogyan az emberek állandóan megosztanak itt bejegyzésekre mutató linkeket.”

A panasz azonban olyan technikai állításokat tartalmaz, amelyek megkérdőjelezik ezt a keretet.

A bejelentés szerint a Reddit tesztbejegyzést készített, amelyet csak a Google keresője tudott feltérképezni, és az interneten máshol nem volt elérhető. Órákon belül ez a rejtett tartalom megjelent a Perplexity találatai között.

A beadványban az is szerepel, hogy miután a Reddit felmondó levelet küldött, a Perplexity által a Redditnek küldött idézetek száma nagyjából negyvenszeresére nőtt.

Hasonló vádak a kiadóktól

A Forbes korábban egy exkluzív és fenyegetett jogi lépés újbóli közzétételével vádolta Perplexity-t.

A Wired arról számolt be, hogy a Perplexity nyilvánosságra nem hozott IP-címeket és hamisított felhasználói ügynök karakterláncokat használt a robots.txt megkerülésére. Vezetékes

A Cloudflare később azt mondta, hogy a Perplexity „lopakodó, nem deklarált bejárókat” használt, amelyek figyelmen kívül hagyták a feltérképezés tilalmát, az augusztusi tesztek alapján.

Hogyan reagált a zavarodottság

A korábbi vitákban a Perplexity azt mondta, hogy a problémák az új termékek durva éleiből fakadtak, és egyértelműbb hozzárendelést ígért.

A vállalat azzal is érvelt, hogy egyes médiaszervezetek megpróbálják ellenőrizni a „nyilvánosan közölt tényeket”.

Ebben a legutóbbi válaszában a Perplexity a Reddit keresetét a szélesebb körű képzési adatokkal kapcsolatos tárgyalások eszközeként fogalmazza meg, és ezt írja:

„Összefoglaljuk a Reddit-beszélgetéseket… Nem zsarolnak ki bennünket, és nem segítünk a Redditnek abban, hogy kizsarolja a Google-t.”

Miért számít ez?

Ez a probléma azért fontos, mert arról van szó, hogy az AI-asszisztensek hogyan használják fel a közönség által olvasott és a kiadók által gyakran hivatkozott fórumtartalmakat.

A jogi kérdések túlmutatnak a képzésen.

A bíróságok megvizsgálhatják, hogy megkerülték-e a technikai ellenőrzéseket, hogy az összefoglalás sérti-e a védett kifejezéseket, és hogy a harmadik féltől származó kaparók használata jogi felelősséghez vezethet-e a downstream termékekért.

Ha a bíróságok elfogadják a Reddit kijátszásellenes érvelését, az megváltoztathatja azt, ahogyan az asszisztensek idézik vagy kapcsolják össze a Reddit-szálakat.

Másrészről, ha a bíróságok egyetértenek Perplexity álláspontjával, az asszisztensek inkább a fórumon folyó vitákra hagyatkozhatnak, amelyeket kevésbé korlátoz az engedélyezés.

Amit még nem tudunk

A beadvány azt állítja, hogy a Perplexity legalább egy kaparócégen keresztül szerezte be az adatokat, de a nyilvános panasz nem határozza meg, hogy melyik szállító milyen adatokat szolgáltatott, és nem tartalmazza a tranzakció részleteit.