دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

AI بالعربي – متابعات

كشفت دراسة أجرتها كلية الطب السريري في جامعة “كامبريدج” عن تطورات واعدة في قدرات نماذج تعلم اللغة “LLMs” في المجال الطبي، إذ أظهر إصدار GPT-4 الأخير من شركة OpenAI، كفاءة ملحوظة في تقييمات طب العيون؛ مما ينافس أداء الخبراء المتمرسين في هذا المجال.

وبحسب تقرير نشره موقع engadget، قارنت الدراسة القدرات التشخيصية لمختلف برامج نماذج تعلم اللغة، بما في ذلك GPT-4 وسلفه GPT-3.5، جنبًا إلى جنب مع PaLM 2 من شركة جوجل وLLaMA من شركة ميتا. وقد تم إجراء التقييم من خلال اختبار وهمي يتكون من 87 سؤالًا متعدد الاختيارات مصدرها كتاب شامل لطب العيون، وتم إجراء التقييم على خمسة أطباء عيون خبراء، وثلاثة أطباء عيون متدربين، وطبيبين مبتدئين غير متخصصين.

وأظهرت النتائج أن جهاز GPT-4 المدعوم بـ”الذكاء الاصطناعي“، تفوق على قدرات المتدربين والأطباء المبتدئين، حيث أجاب بشكل صحيح على 60 سؤالًا من أصل 87. وعلى الرغم من أن هذا الإنجاز تجاوز متوسط أداء الأطباء المبتدئين، الذين سجلوا متوسط 37 إجابة صحيحة، إلا أن GPT-4 تفوق بفارق ضئيل على المتدربين، الذين بلغ متوسطهم 59.7 إجابة صحيحة. ومع ذلك، فقد أسفرت الخبرة الجماعية لأطباء العيون الخبراء عن متوسط درجة 66.4 إجابة صحيحة، متجاوزة أداء GPT-4.

وبالمقارنة، حقق “PaLM 2” درجة 49، في حين سجل “GPT-3.5” نحو 42 نقطة، وتأخر LLaMA بدرجة 28، وهو ما يقل عن مستوى الكفاءة للأطباء المبتدئين.

وعلى الرغم من النتائج الواعدة، أكدت الدراسة أيضًا على العديد من المخاطر والقيود المرتبطة بنماذج تعلم اللغة في التشخيص الطبي، حيث سلط الباحثون الضوء على النطاق المحدود للدراسة، وشددوا على الحاجة إلى مزيد من الاستكشاف عبر مجموعة واسعة من الحالات والسيناريوهات الطبية. وقد أثيرت مخاوف بشأن احتمال قيام نماذج تعلم اللغة بتوليد تشخيصات غير دقيقة أو مضللة، ولا سيما في حالات “الهلوسة”؛ حيث يقوم النموذج بتلفيق معلومات خاطئة.

علاوة على ذلك، فإن النقص المتأصل في الفهم الدقيق لنماذج تعلم اللغة يمثل تحديات إضافية، مما يزيد من خطر عدم الدقة في التقييمات الطبية. وفي حين أن هذه النتائج تشير إلى تقدم كبير في دمج تكنولوجيا الذكاء الاصطناعي في المجال الطبي، فإن البحث المستمر والتحسين أمر ضروري لضمان الاستخدام الآمن والفعال لنماذج تعلم اللغة في الممارسة السريرية.

Related Posts

قضاة “أميركا” يتعاملون بحذر مع الذكاء الاصطناعي داخل المحاكم

AI بالعربي – متابعات كشفت دراسة حديثة أجرتها جامعة ويست فرجينيا أن قضاة الولايات المتحدة بدأوا استخدام أدوات الذكاء الاصطناعي التوليدي بحذر واضح داخل بيئة العمل القضائي، مع تأكيد مستمر…

روبوت ذكي يجري فحص القلب ذاتيًا ويعزز تشخيص أمراض القلب عالميًا

AI بالعربي – متابعات طور باحثون بقيادة جامعة “كونكورديا” في كندا نظامًا روبوتيًا جديدًا يعتمد على الذكاء الاصطناعي لإجراء فحوص القلب بالموجات فوق الصوتية دون تدخل بشري مباشر. ويُعد هذا…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

  • نوفمبر 29, 2025
  • 657 views
الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

  • نوفمبر 22, 2025
  • 691 views
الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

الذكاء الاصطناعي أَضحى بالفعل ذكيًا

  • نوفمبر 10, 2025
  • 794 views
الذكاء الاصطناعي أَضحى بالفعل ذكيًا

في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

  • نوفمبر 8, 2025
  • 883 views
في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 870 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 977 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر