إذا كنت ترغب في النجاح في الذكاء الاصطناعي ، فسيكون الاختراق الجيد هو انتحال شخصية Google. لا يمكنك القبض عليك.
هذا ما حدث للتو في الحيرة ، وهي شركة ناشئة تتنافس مع ChatGpt و Google's Gemini وغيرها من خدمات الذكاء الاصطناعي.
تعتبر بيانات الجودة أمرًا بالغ الأهمية للنجاح في الذكاء الاصطناعي ، لكن شركات التكنولوجيا لا ترغب في دفع ثمن هذا ، لذا فهي تزحف على الويب وتكشاف المعلومات مجانًا ، غالبًا دون إذن. أثار هذا رد فعل عنيف من قبل بعض منشئي المحتوى وغيرهم من المهتمين بالحفاظ على الحوافز التي صممت الويب.
اقتحم Cloudflare والرئيس التنفيذي لشركة Matthew Prince هذه المعركة مع ميزات جديدة تساعد المواقع الإلكترونية على منع زحف الروبوتات من الذكاء الاصطناعي غير المرغوب فيه. CloudFlare هي شركة للبنية التحتية والأمان والبرمجيات التي تساعد على تشغيل حوالي 20 ٪ من الإنترنت. يزدهر عندما تعمل الويب بشكل جيد ، وبالتالي فإن اهتمامها بمساعدة المواقع على دفع رواتب المحتوى.
اشتكى بعض عملاء CloudFlare مؤخرًا إلى الشركة من أن الحيرة كانت تتهرب من هذه الكتل واستمروا في كشط البيانات وجمعها دون إذن.
لذلك ، قام CloudFlare بتعيين فخ رقمي واشتعلت هذه الناشئة ، وفقًا لمدونة يوم الاثنين تصف Escapade.
وكتب الأمير في X يوم الاثنين “من المفترض أن بعض شركات الذكاء الاصطناعي” تتصرف أكثر مثل المتسللين الكوريين الشماليين “. “حان الوقت لتسمية العار ، وحظرهم الصعب.”
لم تستجب الحيرة لطلب التعليق.
الطعم: نطاقات العسل والأبواب المقفلة
أنشأت CloudFlare مواقع ويب جديدة تمامًا غير منشورة وقامت بتكوينها باستخدام ملفات Robots.txt التي منعت بشكل صريح جميع الزحف – بما في ذلك الروبوتات المعلنة في الحيرة ، PerplexityBot و مستخدم محير. لم يكن لدى مواقع الاختبار هذه الروابط العامة ، أو إدخالات محرك البحث ، أو البيانات الوصفية التي تجعلها عادة ما تكون قابلة للاكتشاف.
ومع ذلك ، عندما استفسرت Cloudflare من الذكاء الاصطناعي من الذكاء الاصطناعي مع أسئلة حول هذه المواقع المحددة ، استجابت خدمة بدء التشغيل بمعلومات مفصلة لا يمكن إلا أن تأتي من تلك الصفحات المقيدة. الاستنتاج؟ لقد وصلت الحيرة إلى المحتوى على الرغم من إخباره بوضوح بعدم ذلك.
عباءة: كيف تحجب الحيرة الزحف
زحفت الحيرة في البداية هذه المواقع باستخدام سلسلة وكيل المستخدم الرسمية الخاصة بها ، والامتثال للبروتوكولات القياسية. ومع ذلك ، قال Cloudflare إنها اكتشفت أنه بمجرد حظرها ، لجأت الحيرة إلى تكتيكات التخفي.
وجد CloudFlare أن الحيرة بدأت في نشر زحف غير معلن عن متصفحات ويب عادية وإرسال طلبات من عناوين IP غير معروفة أو مدورة و ASNs غير الرسمية ، وهي معرفات حاسمة تساعد في توجيه حركة المرور على الإنترنت بكفاءة.
عندما تم حظر زحفاتها الرسمية ، استخدمت الحيرة أيضًا متصفح ويب عام مصمم لانتحال شخصية متصفح الكروم من Google على أجهزة كمبيوتر Apple Mac. ((سأل Business Insider Google عما إذا كان قد طلب من الحيرة التوقف عن انتحال شخصية الكروم. لم ترد جوجل).
وفقًا لـ CloudFlare ، فإن الحيرة تقدم ملايين طلبات “التخفي” يوميًا عبر عشرات الآلاف من مجالات الويب.
وأوضح CloudFlare أن هذا السلوك لا ينتهك معايير الويب فحسب ، بل يخون أيضًا الثقة الأساسية التي تدعم أداء الويب المفتوح.
المقارنة: كيف يحصل Openai على صواب
للتأكيد على شكل سلوك الروبوت الجيد ، قارن CloudFlare سلوك Perplexity بدورة Openai's Crawlers ، والتي تتخلص من البيانات لتطوير نماذج ChatGpt ونماذج AI العملاقة مثل GPT-5 القادمة.
عندما واجهت روبوتات Openai ملف Robots.txt أو كتلة مماثلة ، فإنها ببساطة تراجعت. لا تحذب. لا تقنيع. لا زحف الباب الخلفي ، وفقا لاختبارات Cloudflare.
التداعيات: إلغاء التعريف والحظر
نتيجة لهذه النتائج ، قامت CloudFlare بإلغاء إدراج الحيرة في القائمة باعتبارها روبوتًا تم التحقق منه وقام بطرح تقنيات اكتشاف وحظر جديدة عبر شبكتها.
تعمل Cloudflare's Remplare بمثابة حكاية تحذيرية في سباق AI Arms. في حين أن الويب يتحول نحو تحكم أقوى في الوصول إلى البيانات واستخدامها ، فقد يجد الممثلون الذين يرفعون هذه المعايير المتطورة أنفسهم ليسوا محظرين فحسب ، بل تم استدعاؤهم علنًا.
في عصر يتم فيه جوع أنظمة الذكاء الاصطناعى لبيانات التدريب ، تعد عملية CloudFlare Sting إشارة إلى الشركات الناشئة واللاعبين الراسخين على حد سواء: احترام قواعد الويب ، أو المخاطرة التي تعرضها.
اشترك في النشرة الإخبارية لـ BI's Tech Memo هنا. تواصل معي عبر البريد الإلكتروني على [email protected].
(tagstotranslate) الحيرة