ساتيا ناديلا تريد منظمة العفو الدولية أن تكون طبيبك القادم.
أعلن الرئيس التنفيذي لشركة Microsoft عن تقدمين في مجال الرعاية الصحية على وسائل التواصل الاجتماعي هذا الأسبوع ، بما في ذلك Mai-Dxo ، وهو نظام يحاكي العديد من الأطباء الظاهريين الذين يعملون معًا لحل الألغاز الطبية.
في الاختبار ضد 304 حالة معقدة من مجلة نيو إنجلاند للطب ، ذكرت Microsoft أن الذكاء الاصطناعى قد تم تشخيص 85.5 ٪ منها بشكل صحيح. مجموعة من 21 من أطباء ذوي خبرة يعالجون نفس الحالات؟ حصلوا على 20 ٪ على حق.
وكتبت ناديلا: “متحمسًا لمشاركة اثنين من التقدمين الذين يقتربوننا من التأثير في العالم الحقيقي في AI للرعاية الصحية”. “Mai-Dxo هي أوركسترا من النماذج النموذجية التي تحاكي لوحة من الأطباء الظاهريين. وهي تحقق 85.5 ٪ من الدقة التشخيصية-ربع الأوقات التي يتمتع فيها الأطباء ذوي الخبرة-في حين تخفيض تكاليف التشخيص”.
متحمس لمشاركة اثنين من التقدم الذي يقربنا من تأثير العالم الحقيقي في الذكاء الاصطناعي للرعاية الصحية:
يقدم SDBENCH معيارًا جديدًا يحول 304 حالة NEJM إلى محاكاة تشخيصية تفاعلية. يجب أن يطرح الذكاء الاصطناعى أسئلة واختبارات الطلب ووزنه ، مما يعكس تعقيد … pic.twitter.com/lasc4hk730
– ساتيا ناديلا (satyanadella) 30 يونيو 2025
ويأتي هذا الإعلان في الوقت الذي تنضم فيه Microsoft إلى مجال مزدحم لشركات التكنولوجيا التي تتسابق لتطبيق الذكاء الاصطناعى على أكثر مشكلات Healthcare الشائكة.
مع إنفاق الأمريكيين ما يقرب من 5 تريليونات دولار سنويًا على الرعاية الصحية – والأخطاء التشخيصية التي تؤثر على 12 مليون شخص كل عام ، وفقا لجامعة جونز هوبكنز – فكرة استخدام الذكاء الاصطناعى لمعالجة القضايا المتعلقة بالإنسان تبدو وكأنها غير عقلانية.
كيف يعمل المجلس الطبي لشركة Microsoft
يعمل Mai-Dxo مثل فريق Dream Medical محاصر في جهاز كمبيوتر. يعالج النظام الحالات من خلال ما تسميه Microsoft مع معيار التشخيص المتسلسل ، أو SDBENCH.
بدلاً من أسئلة متعددة الخيارات مثل اختبارات الذكاء الاصطناعي التقليدي ، فإنها تعكس كيفية عمل الأطباء فعليًا: بدءًا من معلومات محدودة عن المريض ، وطرح أسئلة المتابعة ، وطلب الاختبارات ، وضبط النظريات مع وصول البيانات الجديدة.
كل اختبار يتحمل تكلفة في الأموال الافتراضية ، مما يجبر الذكاء الاصطناعي على موازنة الدقة ضد الإنفاق على الرعاية الصحية.
وبعبارة أخرى ، فإنه يحاكي بشكل أساسي مجلس طبي يناقش القضية ، مع نماذج مختلفة تلعب أدوارًا مختلفة. تناقش النماذج ، وتختلف ، وفي النهاية تصل إلى توافق في الآراء ، تمامًا مثل أطبائك إذا كنت حالة صعبة للدراسة.
في تكوين واحد ، حقق MAI-DXO دقة 80 ٪ بينما تنفق 2،397 دولارًا لكل حالة ، أي أقل بنسبة 20 ٪ تقريبًا من 2،963 دولارًا ينفقها الأطباء عادةً.
في Peak Performance ، حققت دقة 85.5 ٪ بتكلفة 7،184 دولار لكل حالة. وبالمقارنة ، حقق نموذج Openai المستقل O3 دقة 78.6 ٪ ولكن تكلفة 7،850 دولار.
الصورة: Microsoft
تتضمن لجنة الطبيب الظاهري دكتور فرضية ، التي تحافظ على قائمة جارية للتشخيصات الثلاثة على الأرجح باستخدام طرق احتمال بايزي.
يختار Dr. Test-Chooser ما يصل إلى ثلاثة اختبارات تشخيصية لكل جولة ، بهدف كسب أقصى قدر من المعلومات.
يتصرف الدكتور تشالنجر باعتباره التناقض ، ويبحث عن أدلة تتناقض مع النظرية السائدة. الدكتور الإشراف الفيتات اختبارات باهظة الثمن مع قيمة تشخيصية منخفضة.
وفي الوقت نفسه ، تضمن Dr. Checklist أن جميع أسماء الاختبارات صالحة ويبقى منطق الفريق ثابتًا.

الصورة: Microsoft
اختبرت Microsoft النظام على الحالات المنشورة في مجلة New England Journal of Medicine بين عامي 2024 و 2025 ، بعد تاريخ قطع تدريب الذكاء الاصطناعى ، مما يلغي أي احتمال أن يحفظ النموذج الإجابات.
كانت الدراسات حالات صعبة تتطلب تشخيص الفحص الشامل بشكل صحيح.
كان لدى الأطباء الـ 21 Microsoft التي تم تجنيدها للمقارنة ما بين 5 و 20 عامًا من الخبرة ، مع متوسط 12 عامًا.
لقد عملوا دون الوصول إلى الزملاء أو الكتب المدرسية أو مساعدة الذكاء الاصطناعي لضمان مقارنة عادلة للقدرة التشخيصية الخام. أبلغوا عن معدل نجاح بنسبة 20 ٪ في هذه الحالات الصعبة المعترف بها.
يعمل النظام في عدة أوضاع. توفر “الإجابة الفورية” تشخيصًا يعتمد فقط على المعلومات الأولية مقابل 300 دولار – تكلفة زيارة طبيب واحد.
“سؤال فقط” يسمح أسئلة المتابعة دون طلب اختبارات. تتتبع تكاليف “الموازنة” مع الحد الأقصى للإنفاق. “لا ميزانية” يعطي اللوحة خالية من العرق ، في حين أن “Ensemble” تدير لوحات متعددة ويجمع استنتاجاتها لتحقيق أقصى دقة.
مستقبل الطب؟
يمثل Mai-Dxo دفع Microsoft الأوسع في صحة المستهلك.
تقارير الشركة أكثر من 50 مليون جلسة متعلقة بالصحة يوميًا عبر منتجات Bing و Copilot. من عمليات البحث في آلام الركبة إلى عمليات البحث عن الرعاية العاجلة ، ترى Microsoft محركات البحث ومساعدي الذكاء الاصطناعى يصبحون الباب الأمامي الجديد للرعاية الصحية.
بالطبع ، هذه مجرد خطوة أخرى في جدول زمني طويل جدًا للتكنولوجيا الطبية.
بالنسبة للسياق ، قام نظام Mycin في ستانفورد بتشخيص الالتهابات البكتيرية في سبعينيات القرن الماضي ، ومحادثات AMIE من Google محاكاة الطبيب في العام الماضي فقط.
طورت Microsoft Mai-Dxo كنظام نماذج من النماذج ، مما يعني أنه يمكن أن يعمل مع نماذج الذكاء الاصطناعى من شركات مختلفة.
في الاختبار ، عززت الأداء عبر الطرز من Openai و Google و Nothropic و Meta وغيرها بمعدل 11 ٪. كان التحسن ذو دلالة إحصائية في جميع النماذج التي تم اختبارها.
أكد الدكتور دومينيك كينج وهارشا نوري ، الذي قاد البحث في Microsoft AI ، في منشور مدونة أن التكنولوجيا لا تزال بمثابة مظاهرة بحثية.
وكتبوا: “لا تزال هناك تحديات مهمة قبل أن يتم نشر الذكاء الاصطناعى التوليدي بأمان ومسؤولية عبر الرعاية الصحية”. يتفوق النظام في تحديات التشخيص المعقدة ولكنه يحتاج إلى اختبار على الحالات الروتينية.
تخطط Microsoft لتقديم البحث لمراجعة النظراء وتعمل مع منظمات الرعاية الصحية للتحقق من صحة النهج في الإعدادات السريرية.
أوضحت الشركة أن أي نشر يتطلب “اختبارًا صارمًا للسلامة ، والتحقق السريري ، والمراجعات التنظيمية”.
في الوقت الحالي ، لا يزال Mai-Dxo محصورًا في مختبرات الأبحاث. ولكن مع وجود أخطاء تشخيصية تساهم في ما يقرب من 10 ٪ من وفيات المرضى وتؤثر على الملايين سنويًا ، تمثل لوحة الطبيب الظاهري في Microsoft خطوة أخرى نحو الرعاية الصحية المدعومة من AI.
قد يشخص فريق الذكاء الاصطناعي الخمسة من 21 طبيبًا من البشر ، لكن لا يزال من السابق لأوانه رؤية التنفيذ السائد.
تقول Microsoft إن الذكاء الاصطناعي لن يحل محل الأطباء ؛ سوف يزيدهم. الأطباء الـ 21 الذين سجلوا 20 ٪ في حالات NEJM الوحشية على الأرجح يأملون في أن يكون هذا صحيحًا.
حرره سيباستيان سنكلير وجوش كويتنر