مشغل أداة الذكاء الاصطناعي الذي أطلقته شركة OpenAI، قادر على أداء مهام الويب بشكل مستقل
Investing.com – كشفت شركة OpenAI اليوم عن أداة جديدة للذكاء الاصطناعي (AI)، وهي مصممة لتنفيذ المهام بشكل مستقل على الويب. تستخدم هذه الأداة متصفحها الخاص للتفاعل مع صفحات الويب من خلال الكتابة والنقر والتمرير. كمعاينة بحثية، لدى المشغل بعض القيود ولكنه سيتطور بناءً على تعليقات المستخدمين.
يمكن للمشغل إدارة مجموعة متنوعة من مهام المتصفح المتكررة، بما في ذلك ملء النماذج وطلب البقالة وإنشاء الميمات. تعمل هذه الأداة على توسيع وظائف الذكاء الاصطناعي باستخدام نفس الواجهات والأدوات التي يتفاعل معها البشر يوميًا، مما يوفر الوقت للأشخاص في المهام الروتينية ويوفر فرصًا جديدة للشركات.
من أجل طرح آمن ومتكرر، يتوفر إطلاق المشغل مبدئيًا للمستخدمين المحترفين في الولايات المتحدة على موقع Operator.chatgpt.com. سيساعد هذا الإصدار المبكر في جمع التعليقات من المستخدمين والنظام البيئي الأوسع، مما يتيح التحسينات بمرور الوقت. تتمثل الخطة في توسيع نطاق الوصول إلى مستخدمي Plus وTeam وEnterprise ودمج هذه الإمكانات في ChatGPT في المستقبل.
يتم تشغيل المشغل بواسطة نموذج جديد يسمى وكيل استخدام الكمبيوتر (CUA)، والذي يجمع بين قدرات رؤية GPT-4o والتفكير المتقدم من خلال التعلم المعزز. تم تصميم CUA للتفاعل مع واجهات المستخدم الرسومية (GUIs) مثل الأزرار والقوائم وحقول النص. يمكن للمشغل رؤية المتصفح والتفاعل معه، مما يسمح له باتخاذ إجراء على الويب دون الحاجة إلى عمليات تكامل مخصصة لواجهة برمجة التطبيقات (API).
في حالة وجود تحديات أو أخطاء، يمكن للمشغل استخدام قدراته المنطقية للتصحيح الذاتي. إذا واجهت مهمة لا يمكنها إكمالها، فإنها تعيد التحكم إلى المستخدم، مما يضمن تجربة سلسة وتعاونية.
على الرغم من كونها في مراحلها الأولى، حققت CUA نتائج قياسية جديدة في WebArena وWebVoyager، وهما معياران رئيسيان لاستخدام المتصفح.
لاستخدام المشغل، يحتاج المستخدمون ببساطة إلى وصف المهمة التي يرغبون في القيام بها. يمكن للمستخدمين تولي التحكم في المتصفح البعيد في أي وقت، وتم تصميم المشغل ليطلب من المستخدم تولي المهام التي تتطلب تسجيل الدخول أو تفاصيل الدفع أو عند حل اختبارات CAPTCHA.
يمكن للمستخدمين تخصيص سير العمل الخاص بهم في المشغل عن طريق إضافة تعليمات مخصصة لجميع المواقع أو مواقع محددة. يتيح المشغل أيضًا للمستخدمين حفظ المطالبات للوصول السريع إلى الصفحة الرئيسية، وهو مثالي للمهام المتكررة. يمكن للمستخدمين جعل المشغل يقوم بتشغيل مهام متعددة في وقت واحد عن طريق إنشاء محادثات جديدة.
يقوم المشغل بتحويل الذكاء الاصطناعي من أداة سلبية إلى مشارك نشط في النظام البيئي الرقمي. ويهدف إلى تبسيط المهام للمستخدمين وتقديم فوائد للشركات التي تسعى إلى تجارب عملاء مبتكرة ومعدلات تحويل أعلى. يجري التعاون مع شركات مثل DoorDash (NASDAQ:)، وInstacart (NASDAQ:)، وOpenTable، وPriceline، وStubHub، وThumbtack، وUber (NYSE:)، وغيرها لضمان تلبية المشغل لاحتياجات العالم الحقيقي مع احترام المعايير المعمول بها. يتم أيضًا بذل الجهود لتحسين إمكانية الوصول وكفاءة بعض مسارات العمل، خاصة في تطبيقات القطاع العام، من خلال العمل مع منظمات مثل مدينة ستوكتون لتبسيط التسجيل في خدمات وبرامج المدينة.
تم إنشاء هذه المقالة بدعم من الذكاء الاصطناعي ومراجعتها بواسطة أحد المحررين. لمزيد من المعلومات، راجع الشروط والأحكام الخاصة بنا.