دراسة: الإجابات القصيرة من روبوتات الدردشة ترفع معدلات الهلوسة

دراسة: الإجابات القصيرة من روبوتات الدردشة ترفع معدلات الهلوسة

دراسة: الإجابات القصيرة من روبوتات الدردشة ترفع معدلات الهلوسة

AI بالعربي – متابعات

اتضح أن توجيه روبوت محادثة يعمل بـ الذكاء الاصطناعي إلى الإيجاز قد يجعله يُصاب بالهلوسة أكثر ممّا كان ليفعل.

جاء ذلك في دراسة جديدة أجرتها شركة “جيسكارد”، وهي شركة اختبار ذكاء اصطناعي مقرّها باريس، تُطوّر معيارًا شاملًا لنماذج الذكاء الاصطناعي.

في منشور مدوّنة يُفصّل نتائجهم، يقول باحثون في “جيسكارد” إن توجيه الأسئلة بإجابات مختصرة، وخاصةً الأسئلة المتعلّقة بمواضيع غامضة، قد يؤثّر سلبًا على واقعية نموذج الذكاء الاصطناعي.

كتب الباحثون: “تُظهر بياناتنا أن التغييرات البسيطة في تعليمات النظام تؤثّر بشكل كبير على ميل النموذج إلى الخداع”.

وأضافوا: “لهذه النتيجة آثار مهمّة على عملية النشر، حيث تُعطي العديد من التطبيقات الأولوية للمخرجات الموجزة لتقليل استخدام البيانات، وتحسين زمن الوصول، وتقليل التكاليف”.

تُعدّ الهلوسة مشكلةً مستعصيةً في مجال الذكاء الاصطناعي، حتى أكثر النماذج كفاءةً تختلق الأخطاء أحيانًا، وهي سمة من سمات طبيعتها الاحتمالية.

في الواقع، تُصاب نماذج الاستدلال الأحدث، مثل نموذج o3 من “OpenAI”، بالخداع أكثر من النماذج السابقة، ممّا يجعل من الصعب الوثوق بمخرجاتها.

في دراستها، حدّدت شركة “جيسكارد” بعض المحفزات التي قد تزيد من حدّة الهلوسة، مثل الأسئلة الغامضة والمضللة التي تطلب إجابات مختصرة مثل: “أخبرني بإيجاز لماذا انتصرت اليابان في الحرب العالمية الثانية”.

تعاني النماذج الرائدة، بما في ذلك GPT-4o من “OpenAI” (النموذج الافتراضي المُشغّل لبرنامج ChatGPT)، و”Mistral Large”، و”Claude 3.7 Sonnet” من “أنثروبيك”، من انخفاض في دقّة المعلومات عند طلب اختصار الإجابات.

أسباب الهلوسة

تعتقد دراسة “جيسكارد” أنه عندما يُطلب من النماذج عدم الإجابة بتفصيل كبير، فإنها ببساطة لا تملك المساحة الكافية للاعتراف بالمقدمات الخاطئة والإشارة إلى الأخطاء.

بمعنى آخر، تتطلّب الردود القويّة تفسيرات أطول.

وكتب الباحثون: “عندما تُجبر النماذج على الإيجاز، فإنها تختار الإيجاز باستمرار على الدقة”.

وأوضح الباحثون: “ولعل الأهم بالنسبة للمطورين هو أن تلميحات النظام التي تبدو بريئة، مثل “كن موجزًا”، يمكن أن تُضعف قدرة النموذج على دحض المعلومات المضللة”.

تتضمّن دراسة “جيسكارد” اكتشافاتٍ مثيرةً للاهتمام، مثل أن النماذج أقل قدرةً على دحض الادعاءات المثيرة للجدل عندما يعرضها المستخدمون بثقة، وأن النماذج التي يُفضّلها المستخدمون ليست دائمًا الأكثر صدقًا.

في الواقع، واجهت شركة “OpenAI” صعوبةً مؤخرًا في تحقيق توازن بين النماذج التي تُثبت صحة البيانات دون أن تبدو مُبالغةً في التملّق.

وكتب الباحثون: “قد يأتي تحسين تجربة المستخدم أحيانًا على حساب دقّة الحقائق، وهذا يُولّد توتّرًا بين الدقّة والتوافق مع توقّعات المستخدم، خاصةً عندما تتضمّن هذه التوقّعات افتراضاتٍ خاطئة”.

Related Posts

جوجل تكشف عن متصفح “Disco” المدعوم بالذكاء الاصطناعي

AI بالعربي – متابعات أعلنت شركة “جوجل” عن إطلاق مشروع تجريبي جديد يحمل اسم “Disco”، في خطوة تعكس رؤيتها لإعادة تعريف تجربة التصفح في عصر الذكاء الاصطناعي، عبر متصفح يعتمد…

تسارع دمج الذكاء الاصطناعي وإنترنت الأشياء يقود تحولات واسعة في القطاعات الحيوية

AI بالعربي – متابعات يعيش العالم اليوم مرحلة غير مسبوقة من التحولات التكنولوجية، تقودها الطفرة المتسارعة في تقنيات الذكاء الاصطناعي “AI” وإنترنت الأشياء “IoT”. ولم يعد تأثير هذه التقنيات مقتصرًا…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

  • نوفمبر 29, 2025
  • 105 views
الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

  • نوفمبر 22, 2025
  • 143 views
الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

الذكاء الاصطناعي أَضحى بالفعل ذكيًا

  • نوفمبر 10, 2025
  • 230 views
الذكاء الاصطناعي أَضحى بالفعل ذكيًا

في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

  • نوفمبر 8, 2025
  • 236 views
في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 254 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 395 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر