دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

AI بالعربي – متابعات

كشفت دراسة أجرتها كلية الطب السريري في جامعة “كامبريدج” عن تطورات واعدة في قدرات نماذج تعلم اللغة “LLMs” في المجال الطبي، إذ أظهر إصدار GPT-4 الأخير من شركة OpenAI، كفاءة ملحوظة في تقييمات طب العيون؛ مما ينافس أداء الخبراء المتمرسين في هذا المجال.

وبحسب تقرير نشره موقع engadget، قارنت الدراسة القدرات التشخيصية لمختلف برامج نماذج تعلم اللغة، بما في ذلك GPT-4 وسلفه GPT-3.5، جنبًا إلى جنب مع PaLM 2 من شركة جوجل وLLaMA من شركة ميتا. وقد تم إجراء التقييم من خلال اختبار وهمي يتكون من 87 سؤالًا متعدد الاختيارات مصدرها كتاب شامل لطب العيون، وتم إجراء التقييم على خمسة أطباء عيون خبراء، وثلاثة أطباء عيون متدربين، وطبيبين مبتدئين غير متخصصين.

وأظهرت النتائج أن جهاز GPT-4 المدعوم بـ”الذكاء الاصطناعي“، تفوق على قدرات المتدربين والأطباء المبتدئين، حيث أجاب بشكل صحيح على 60 سؤالًا من أصل 87. وعلى الرغم من أن هذا الإنجاز تجاوز متوسط أداء الأطباء المبتدئين، الذين سجلوا متوسط 37 إجابة صحيحة، إلا أن GPT-4 تفوق بفارق ضئيل على المتدربين، الذين بلغ متوسطهم 59.7 إجابة صحيحة. ومع ذلك، فقد أسفرت الخبرة الجماعية لأطباء العيون الخبراء عن متوسط درجة 66.4 إجابة صحيحة، متجاوزة أداء GPT-4.

وبالمقارنة، حقق “PaLM 2” درجة 49، في حين سجل “GPT-3.5” نحو 42 نقطة، وتأخر LLaMA بدرجة 28، وهو ما يقل عن مستوى الكفاءة للأطباء المبتدئين.

وعلى الرغم من النتائج الواعدة، أكدت الدراسة أيضًا على العديد من المخاطر والقيود المرتبطة بنماذج تعلم اللغة في التشخيص الطبي، حيث سلط الباحثون الضوء على النطاق المحدود للدراسة، وشددوا على الحاجة إلى مزيد من الاستكشاف عبر مجموعة واسعة من الحالات والسيناريوهات الطبية. وقد أثيرت مخاوف بشأن احتمال قيام نماذج تعلم اللغة بتوليد تشخيصات غير دقيقة أو مضللة، ولا سيما في حالات “الهلوسة”؛ حيث يقوم النموذج بتلفيق معلومات خاطئة.

علاوة على ذلك، فإن النقص المتأصل في الفهم الدقيق لنماذج تعلم اللغة يمثل تحديات إضافية، مما يزيد من خطر عدم الدقة في التقييمات الطبية. وفي حين أن هذه النتائج تشير إلى تقدم كبير في دمج تكنولوجيا الذكاء الاصطناعي في المجال الطبي، فإن البحث المستمر والتحسين أمر ضروري لضمان الاستخدام الآمن والفعال لنماذج تعلم اللغة في الممارسة السريرية.

Related Posts

الذكاء الاصطناعي المتعاطف يهدد العلاج النفسي ويحوّل البيانات العاطفية إلى سلعة

AI بالعربي – متابعات يتسارع انتشار ما يُعرف بـ “الذكاء الاصطناعي المتعاطف” ومنصات الصحة النفسية الرقمية، ليصنع سردية جذابة تقوم على وكلاء محادثة متاحين دائماً، لا يُصدرون أحكاماً، ويُقدَّمون باعتبارهم…

تحذير علمي: مخاطر الذكاء الاصطناعي قد تصل إلى تهديد بقاء البشر

AI بالعربي – متابعات أطلق الباحث المتخصص في أمن الذكاء الاصطناعي رومان يامبولسكي تحذيراً لافتاً بشأن المخاطر الوجودية التي قد تُشكّلها التقنيات الذكية خلال القرن المقبل، مشيراً إلى أن احتمال…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

  • نوفمبر 29, 2025
  • 89 views
الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

  • نوفمبر 22, 2025
  • 124 views
الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

الذكاء الاصطناعي أَضحى بالفعل ذكيًا

  • نوفمبر 10, 2025
  • 209 views
الذكاء الاصطناعي أَضحى بالفعل ذكيًا

في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

  • نوفمبر 8, 2025
  • 215 views
في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 235 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 378 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر