دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

AI بالعربي – متابعات

كشفت دراسة أجرتها كلية الطب السريري في جامعة “كامبريدج” عن تطورات واعدة في قدرات نماذج تعلم اللغة “LLMs” في المجال الطبي، إذ أظهر إصدار GPT-4 الأخير من شركة OpenAI، كفاءة ملحوظة في تقييمات طب العيون؛ مما ينافس أداء الخبراء المتمرسين في هذا المجال.

وبحسب تقرير نشره موقع engadget، قارنت الدراسة القدرات التشخيصية لمختلف برامج نماذج تعلم اللغة، بما في ذلك GPT-4 وسلفه GPT-3.5، جنبًا إلى جنب مع PaLM 2 من شركة جوجل وLLaMA من شركة ميتا. وقد تم إجراء التقييم من خلال اختبار وهمي يتكون من 87 سؤالًا متعدد الاختيارات مصدرها كتاب شامل لطب العيون، وتم إجراء التقييم على خمسة أطباء عيون خبراء، وثلاثة أطباء عيون متدربين، وطبيبين مبتدئين غير متخصصين.

وأظهرت النتائج أن جهاز GPT-4 المدعوم بـ”الذكاء الاصطناعي“، تفوق على قدرات المتدربين والأطباء المبتدئين، حيث أجاب بشكل صحيح على 60 سؤالًا من أصل 87. وعلى الرغم من أن هذا الإنجاز تجاوز متوسط أداء الأطباء المبتدئين، الذين سجلوا متوسط 37 إجابة صحيحة، إلا أن GPT-4 تفوق بفارق ضئيل على المتدربين، الذين بلغ متوسطهم 59.7 إجابة صحيحة. ومع ذلك، فقد أسفرت الخبرة الجماعية لأطباء العيون الخبراء عن متوسط درجة 66.4 إجابة صحيحة، متجاوزة أداء GPT-4.

وبالمقارنة، حقق “PaLM 2” درجة 49، في حين سجل “GPT-3.5” نحو 42 نقطة، وتأخر LLaMA بدرجة 28، وهو ما يقل عن مستوى الكفاءة للأطباء المبتدئين.

وعلى الرغم من النتائج الواعدة، أكدت الدراسة أيضًا على العديد من المخاطر والقيود المرتبطة بنماذج تعلم اللغة في التشخيص الطبي، حيث سلط الباحثون الضوء على النطاق المحدود للدراسة، وشددوا على الحاجة إلى مزيد من الاستكشاف عبر مجموعة واسعة من الحالات والسيناريوهات الطبية. وقد أثيرت مخاوف بشأن احتمال قيام نماذج تعلم اللغة بتوليد تشخيصات غير دقيقة أو مضللة، ولا سيما في حالات “الهلوسة”؛ حيث يقوم النموذج بتلفيق معلومات خاطئة.

علاوة على ذلك، فإن النقص المتأصل في الفهم الدقيق لنماذج تعلم اللغة يمثل تحديات إضافية، مما يزيد من خطر عدم الدقة في التقييمات الطبية. وفي حين أن هذه النتائج تشير إلى تقدم كبير في دمج تكنولوجيا الذكاء الاصطناعي في المجال الطبي، فإن البحث المستمر والتحسين أمر ضروري لضمان الاستخدام الآمن والفعال لنماذج تعلم اللغة في الممارسة السريرية.

Related Posts

منصة “Moltbook” تضع وكلاء الذكاء الاصطناعي في عالم اجتماعي جديد بين الإبهار والمخاطر

برزت منصة “Moltbook” كواحدة من أغرب الظواهر التقنية الحديثة، بعد تقديمها نموذجًا لشبكة اجتماعية يعيش فيها وكلاء الذكاء الاصطناعي حياة اجتماعية رقمية.المنصة تسمح للبشر بالمشاهدة فقط، بينما يتفاعل الوكلاء فيما…

الذكاء الاصطناعي و”Fine-tuning”.. تخصيص نموذج للمؤسسات: ذكاء يفهم سياقك أم يتحيز له؟

AI بالعربي – متابعات مع توسّع استخدام النماذج اللغوية داخل المؤسسات، لم يعد الاكتفاء بنموذج عام كافيًا. الشركات تريد نموذجًا “يفهمها”، يعرف مصطلحاتها الداخلية، أسلوبها، وسياساتها. هنا يظهر Fine-tuning بوصفه…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

  • نوفمبر 29, 2025
  • 263 views
الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

  • نوفمبر 22, 2025
  • 293 views
الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

الذكاء الاصطناعي أَضحى بالفعل ذكيًا

  • نوفمبر 10, 2025
  • 394 views
الذكاء الاصطناعي أَضحى بالفعل ذكيًا

في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

  • نوفمبر 8, 2025
  • 431 views
في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 436 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 546 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر