دراسة تكشف كفاءة GPT-4 مقارنة بأطباء العيون في تقييمات العين

AI بالعربي – متابعات

كشفت دراسة أجرتها كلية الطب السريري في جامعة “كامبريدج” عن تطورات واعدة في قدرات نماذج تعلم اللغة “LLMs” في المجال الطبي، إذ أظهر إصدار GPT-4 الأخير من شركة OpenAI، كفاءة ملحوظة في تقييمات طب العيون؛ مما ينافس أداء الخبراء المتمرسين في هذا المجال.

وبحسب تقرير نشره موقع engadget، قارنت الدراسة القدرات التشخيصية لمختلف برامج نماذج تعلم اللغة، بما في ذلك GPT-4 وسلفه GPT-3.5، جنبًا إلى جنب مع PaLM 2 من شركة جوجل وLLaMA من شركة ميتا. وقد تم إجراء التقييم من خلال اختبار وهمي يتكون من 87 سؤالًا متعدد الاختيارات مصدرها كتاب شامل لطب العيون، وتم إجراء التقييم على خمسة أطباء عيون خبراء، وثلاثة أطباء عيون متدربين، وطبيبين مبتدئين غير متخصصين.

وأظهرت النتائج أن جهاز GPT-4 المدعوم بـ”الذكاء الاصطناعي“، تفوق على قدرات المتدربين والأطباء المبتدئين، حيث أجاب بشكل صحيح على 60 سؤالًا من أصل 87. وعلى الرغم من أن هذا الإنجاز تجاوز متوسط أداء الأطباء المبتدئين، الذين سجلوا متوسط 37 إجابة صحيحة، إلا أن GPT-4 تفوق بفارق ضئيل على المتدربين، الذين بلغ متوسطهم 59.7 إجابة صحيحة. ومع ذلك، فقد أسفرت الخبرة الجماعية لأطباء العيون الخبراء عن متوسط درجة 66.4 إجابة صحيحة، متجاوزة أداء GPT-4.

وبالمقارنة، حقق “PaLM 2” درجة 49، في حين سجل “GPT-3.5” نحو 42 نقطة، وتأخر LLaMA بدرجة 28، وهو ما يقل عن مستوى الكفاءة للأطباء المبتدئين.

وعلى الرغم من النتائج الواعدة، أكدت الدراسة أيضًا على العديد من المخاطر والقيود المرتبطة بنماذج تعلم اللغة في التشخيص الطبي، حيث سلط الباحثون الضوء على النطاق المحدود للدراسة، وشددوا على الحاجة إلى مزيد من الاستكشاف عبر مجموعة واسعة من الحالات والسيناريوهات الطبية. وقد أثيرت مخاوف بشأن احتمال قيام نماذج تعلم اللغة بتوليد تشخيصات غير دقيقة أو مضللة، ولا سيما في حالات “الهلوسة”؛ حيث يقوم النموذج بتلفيق معلومات خاطئة.

علاوة على ذلك، فإن النقص المتأصل في الفهم الدقيق لنماذج تعلم اللغة يمثل تحديات إضافية، مما يزيد من خطر عدم الدقة في التقييمات الطبية. وفي حين أن هذه النتائج تشير إلى تقدم كبير في دمج تكنولوجيا الذكاء الاصطناعي في المجال الطبي، فإن البحث المستمر والتحسين أمر ضروري لضمان الاستخدام الآمن والفعال لنماذج تعلم اللغة في الممارسة السريرية.

Related Posts

العلماء يدربون الذكاء الاصطناعي لمحاكاة التفكير البشري

العلماء يدربون الذكاء الاصطناعي لمحاكاة التفكير البشري AI بالعربي – متابعات في عالم الذكاء الاصطناعي المتطور باستمرار، يشهد عالمنا تحولاً مذهلًا لا يهدف فقط إلى تسليط الضوء على كيفية تفكير…

معركة الزيارات بدأت.. وChatGPT يغير قواعد النشر الرقمي

معركة الزيارات بدأت.. وChatGPT يغير قواعد النشر الرقمي AI بالعربي – متابعات في ظل تزايد الاعتماد على أدوات الذكاء الاصطناعي كمصدر للأخبار، كشفت بيانات حديثة أن الإشارات القادمة من ChatGPT…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

You Missed

خبراء التقنية يكشفون عن أهم المهارات المطلوبة في عصر الذكاء الاصطناعي

  • من admin
  • يوليو 3, 2025
  • 1 views
خبراء التقنية يكشفون عن أهم المهارات المطلوبة في عصر الذكاء الاصطناعي

“إزالة الضوضاء الحسابية” في البيانات الكبيرة.. هل يمكن تنقية الواقع؟

  • من admin
  • يوليو 3, 2025
  • 2 views
“إزالة الضوضاء الحسابية” في البيانات الكبيرة.. هل يمكن تنقية الواقع؟

دراسة حديثة: روبوتات الذكاء الاصطناعي قد تقدم معلومات صحية خاطئة وخطيرة

  • من admin
  • يوليو 3, 2025
  • 1 views
دراسة حديثة: روبوتات الذكاء الاصطناعي قد تقدم معلومات صحية خاطئة وخطيرة

“التحكم الأخلاقي الذاتي” في الأنظمة المستقلة.. من يحدد الصواب والخطأ؟

  • من admin
  • يوليو 3, 2025
  • 2 views
“التحكم الأخلاقي الذاتي” في الأنظمة المستقلة.. من يحدد الصواب والخطأ؟

“الاسترجاع الديناميكي للذاكرة”.. هل يمكن للنماذج أن تتذكر وتتجاهل بوعي؟

  • من admin
  • يوليو 3, 2025
  • 1 views
“الاسترجاع الديناميكي للذاكرة”.. هل يمكن للنماذج أن تتذكر وتتجاهل بوعي؟

“التحسين التطوري متعدد الأهداف”.. كيف يتوازن الذكاء الاصطناعي مع تعدد المعايير؟

  • من admin
  • يوليو 3, 2025
  • 2 views
“التحسين التطوري متعدد الأهداف”.. كيف يتوازن الذكاء الاصطناعي مع تعدد المعايير؟