رفع موقع Reddit دعوى قضائية ضد شركة Perplexity، إلى جانب العديد من شركات التنقيب عن البيانات الأخرى، متهمًا إياها بسرقة البيانات القيمة لمنصة التواصل الاجتماعي.
وقالت الدعوى، المرفوعة يوم الأربعاء في محكمة مانهاتن الفيدرالية، إن الشركات تحايلت بشكل غير قانوني على حواجز الحماية الرقمية للحصول على البيانات المستخدمة لتدريب نماذج الذكاء الاصطناعي.
وقالت الدعوى القضائية إن أدوات الذكاء الاصطناعي الخاصة بشركة Perplexity استخدمت تعليقات Reddit لتوليد إجابات للمستخدمين، حتى بعد موافقة الشركة على عدم استخراج بيانات Reddit.
قالت Reddit إنها أرسلت خطاب توقف وكف إلى Perplexity في مايو 2024 تطالبها بالتوقف عن حذف بيانات Reddit ما لم تبرم صفقة مع شركة التواصل الاجتماعي، كما فعلت Google وOpenAI.
وقالت شركة Perplexity إنها “لم تكن تستخدم محتوى Reddit لتدريب أي نماذج للذكاء الاصطناعي وأنها ستحترم ملف robots.txt الخاص بـ Reddit”، وفقًا للدعوى القضائية. وأضافت الدعوى القضائية أن استشهادات Perplexity لـ Reddit زادت “أربعين ضعفًا بعد أن طلبت Reddit منها التوقف”.
تقول الدعوى القضائية: “بدلاً من احترام Reddit وحقوق مستخدميه، فإن ما فعلته شركة Perplexity ردًا على ذلك هو ببساطة ابتكار مخططات مراوغة بشكل متزايد للتحايل على أنظمة وسياسات Reddit الأمنية”.
وفقًا للدعوى القضائية، يبدو أن شركة Perplexity قد استخدمت أدوات استخراج بيانات تابعة لجهات خارجية للتحايل على حواجز الحماية الرقمية لـ Reddit من خلال نقل محتوى Reddit من خلال نتائج محرك بحث Google.
“بعبارة أخرى، فإن نموذج أعمال Perplexity هو بشكل فعال أخذ محتوى Reddit من نتائج بحث Google، وإدخاله في LLM لطرف ثالث، وتسميته منتجًا جديدًا”، كما تقول الدعوى القضائية. “على الرغم من أن نموذج الأعمال هذا قد تُرجم بطريقة أو بأخرى إلى تقييم بقيمة 20 مليار دولار، إلا أنه لم يؤد إلى الاستعداد للدفع مقابل ما يملكه الآخرون (بما في ذلك جوجل)”.
وقال المتحدث باسم بيربليكسيتي جيسي دواير إن الشركة “ستكافح دائمًا بقوة من أجل حقوق المستخدمين في الوصول بحرية ونزاهة إلى المعرفة العامة”.
وقال دواير: “يظل نهجنا مبدئيًا ومسؤولًا حيث نقدم إجابات واقعية باستخدام الذكاء الاصطناعي الدقيق، ولن نتسامح مع التهديدات ضد الانفتاح والمصلحة العامة”.
أما المدعى عليهم الآخرون في الدعوى القضائية – Oxylabs UAB وAWMProxy وSerpApi – فهم شركات تبحث في الإنترنت عن البيانات ثم تبيع البيانات إلى شركات ذكاء اصطناعي أخرى، وفقًا للدعوى القضائية.
وقالت الدعوى القضائية التي رفعتها Reddit إن شركة Perplexity ربما استخدمت واحدة على الأقل من تلك الشركات، وأنها سحبت البيانات من خلال نتائج Google لصفحات الويب Reddit.
“بمعنى حقيقي للغاية، فإن هؤلاء المدعى عليهم يشبهون لصوص البنوك المحتملين، الذين، مع علمهم أنهم لا يستطيعون الوصول إلى قبو البنك، اقتحموا الشاحنة المدرعة التي تحمل الأموال بدلاً من ذلك،” كما تزعم الدعوى القضائية التي رفعها موقع Reddit.
وأكد متحدث باسم Reddit لموقع Business Insider أن الشركة أنفقت عشرات الملايين من الدولارات على أنظمة مكافحة الخدش، والتي تقول الدعوى القضائية إن هذه الشركات تحايلت عليها.
لم يستجب ممثلو SerpApi وOxylabs على الفور لطلب التعليق من Business Insider. ولم يتسن على الفور الوصول إلى AWMProxy، التي تم تحديدها في الدعوى على أنها شبكة روبوت روسية سابقة، للتعليق.
وفي تصريح لموقع Business Insider، قال بن لي، كبير المسؤولين القانونيين في Reddit، إن Oxylabs UAB وAWM Proxy وSerpAI كانت “أمثلة نموذجية” للكاشطات غير القانونية.
وقال: “تتجاوز أدوات الكشط الحماية التكنولوجية لسرقة البيانات، ثم بيعها للعملاء المتعطشين للمواد التدريبية”. “يعد Reddit هدفًا رئيسيًا لأنه أحد أكبر مجموعات المحادثات البشرية وأكثرها ديناميكية على الإطلاق.”
هذه القصة تتطور وسيتم تحديثها.