الاسواق العالمية

يوضح هذا العرض التجريبي العميق مدى جودة نموذج الذكاء الاصطناعى الصيني في الرياضيات والمنطق

  • منافسة عارضات الأزياء من الذكاء الاصطناعي من Deepseek ، تتفوق في بعض المهام المعقدة.
  • تستخدم النماذج حساب وقت الاستدلال ، وتحطيم الاستعلامات إلى مهام أصغر يمكن التحكم فيها.
  • يوضح وضع DeepSeek DeepThink عملية التفكير ، وحل مشاكل الرياضيات الصعبة.

أصدرت صينية AI Lab Deepseek مؤخرًا نماذج منظمة العفو الدولية التي تتطابق مع أو تتجاوز بعض العروض العليا لوادي السيليكون.

يستخدم Deepseek نهجًا يسمى وقت الاختبار أو حساب وقت الاستنتاج، التي تقوم بتقسيم الاستعلامات إلى مهام أصغر ، وتحول كل منها إلى موجه جديد يتناوله النموذج. تتطلب كل خطوة تشغيل طلب جديد ، يُعرف باسم الاستدلال مرحلة في الذكاء الاصطناعي.

اختبرت Business Insider مؤخراً أحد طرز Deepseek باستخدام وضع DeepThink الخاص به ، والذي يوضح للمستخدمين كل خطوة من عملية التفكير.

لقد قدمنا ​​للموديل مشكلة في الرياضيات متعددة الخطوات التي اقترحها تشارلي سنيل ، باحث منظمة العفو الدولية في جامعة كاليفورنيا في بيركلي.

قال Snell إن Deepseek يؤدي أداءً جيدًا في مشاكل الرياضيات المعقدة التي يجب حلها من خلال التفكير لفترة أطول ومراحل. اختار الباحث مشاكل من امتحان الرياضيات الدعوة الأمريكية ، وهو اختبار صعب للرياضيات في المدارس الثانوية.

وقال سنيل لـ BI في مقابلة “لقد وضعت أسئلة من ذلك في نموذج Deepseek”. “قرأت من خلال سلسلة الفكر. لقد كان مفهوما.”

عرض Deepseek

إليكم مشكلة الرياضيات التي اقترحتها Snell لتوضيح BI's Deepseek: “ابحث عن تسلسل +، -، /، * الذي يمكن تطبيقه على الأرقام 7 ، 3 ، 11 ، 5 للوصول إلى 24 ، حيث يتم استخدام كل من الأرقام المعطاة بالضبط مرة واحدة. “

وضع BI هذا الموجه في نافذة دردشة Deepseek على موقعها على الويب. استجاب النموذج في البداية من خلال وضع التحدي المقبلة.

حسنًا ، لذلك لدي هذه المشكلة هنا: أحتاج إلى استخدام الأرقام 7 و 3 و 11 و 5 ، ودمجها مع عمليات الإضافة والطرح والضرب والقسمة ، باستخدام كل رقم مرة واحدة تمامًا ، للحصول إلى 24، “أجاب”.للوهلة الأولى ، يبدو هذا أمرًا صعبًا بعض الشيء ، لكنني أعتقد أنه مع بعض التفكير المنهجي ، يمكنني معرفة ذلك

ثم انتقل عبر خطوات متعددة على ما يقرب من 16 صفحة من النقاش التي شملت الحسابات والمعادلات الرياضية. في بعض الأحيان أخطأ النموذج ، لكنه اكتشف هذا ولم يستسلم. بدلاً من ذلك ، تحركت بسرعة لتجربة حل آخر ممكن ، ثم آخر.

اقتربت تقريبًا من هناك مع 33 /7 * 5 ≈ 23.57 ، ولكن ليس 24. ربما أحتاج إلى تجربة مقاربة مختلفة، “كتبت في وقت ما.

في وقت لاحق ، بدا أن نموذج Deepseek يمسك نفسه بتكرار حل محتمل.

انتظر ، لقد فعلت ذلك بالفعل ،“كتب النموذج.”حسنًا ، ربما أحتاج إلى التفكير في استخدام التقسيم بطريقة مختلفة.

بعد بضع دقائق ، وجدت الإجابة الصحيحة.

وقال سنيل: “يمكنك أن ترى ذلك جرب أفكارًا مختلفة وتراجعًا”. سلط الضوء على هذا الجزء من سلسلة فكر ديبسيك على أنه جدير بالملاحظة بشكل خاص:

هذا هو الاستهلاك الوقت حقا. ربما أحتاج إلى التفكير في استراتيجية مختلفة، “كتب نموذج الذكاء الاصطناعي.”بدلاً من الجمع بين رقمين في وقت واحد ، ربما يجب أن أبحث عن طريقة لتجميعهما بشكل مختلف أو استخدام العمليات بطريقة متداخلة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى