جامعة “جونز هوبكنز”: الذكاء الاصطناعي يفشل في فهم التفاعلات الاجتماعية

جامعة "جونز هوبكنز": الذكاء الاصطناعي يفشل في فهم التفاعلات الاجتماعية

جامعة “جونز هوبكنز”: الذكاء الاصطناعي يفشل في فهم التفاعلات الاجتماعية

AI بالعربي – متابعات

كشفت دراسة حديثة صادرة عن جامعة “جونز هوبكنز” أن أنظمة الذكاء الاصطناعي، على الرغم من تطورها، لا تزال عاجزة عن فهم أبسط التفاعلات البشرية. الدراسة التي عُرضت في مؤتمر “التعلم التمثيلي الدولي – ICLR” أبرزت أن هذه النماذج تفشل في قراءة السياق الاجتماعي مثلما يفعل الإنسان بالفطرة.

التجربة بين البشر والذكاء الاصطناعي

أجرى الباحثون تجربة تضمنت عرض مقاطع فيديو قصيرة مدتها ثلاث ثوانٍ على مشاركين بشريين لتقييم درجة التفاعل الاجتماعي، ثم طُبّقت التجربة نفسها على أكثر من 350 نموذجاً من نماذج الذكاء الاصطناعي. في حين اتفق البشر بدرجة كبيرة في تقييماتهم، عجزت النماذج عن الوصول إلى نفس المستوى من الدقة، خاصة تلك التي تعتمد على الفيديو.

قصور النماذج اللغوية والبصرية

النماذج البصرية القائمة على الفيديو كانت الأضعف أداءً، إذ لم تستطع التمييز بين التفاعل الاجتماعي والسلوك المستقل. أما النماذج المعتمدة على الصور الثابتة فلم تتمكن من التنبؤ بدقة بما إذا كان الأشخاص يتواصلون أم لا. في المقابل، أظهرت النماذج اللغوية أداءً أفضل نسبياً عند تحليل أوصاف مكتوبة للمشاهد، لكنها لم تستطع استيعاب السياق الديناميكي للمشهد.

تفسير علمي للفجوة

أوضحت الدكتورة ليلى إيشيك، الأستاذة المساعدة في علم الإدراك والمؤلفة الرئيسية للدراسة، أن جذور المشكلة تعود إلى البنية الأساسية للشبكات العصبية، التي صُممت لمعالجة الصور الثابتة أكثر من فهم الحركة والنية. وأشارت إلى أن التفاعلات الاجتماعية معقدة وتتطلب مستوى أعمق من التحليل يشمل الإشارات الخفية ولغة الجسد وتغير السياق.

تأثيرات على مستقبل الذكاء الاصطناعي

يحمل هذا القصور انعكاسات مباشرة على استخدام الذكاء الاصطناعي في مجالات حيوية مثل السيارات ذاتية القيادة، الروبوتات المساعدة، والمساعدين الافتراضيين. فالتردد البسيط لمشاة على الطريق، أو تبادل نظرات بين شخصين، قد يمثل فارقاً بين استجابة آمنة وأخرى خاطئة.

دعوة لإعادة التفكير في تصميم النماذج

أكدت الباحثة المشاركة كاثي غارسيا أن النتائج تشكل “جرس إنذار” بضرورة إعادة النظر في كيفية تصميم وتدريب نماذج الذكاء الاصطناعي. وأضافت أن النجاح في التعرف على الوجوه أو الأجسام في الصور الثابتة لا يعني القدرة على فهم التفاعلات الاجتماعية المعقدة، وهو ما يبقي البشر حتى الآن متفوقين في هذا المجال.

البشر ما زالوا الأفضل

خلصت الدراسة إلى أن أحد أكبر التحديات أمام الذكاء الاصطناعي ليس التفوق على البشر في الألعاب أو إنتاج النصوص، بل القدرة على فهم لحظة صامتة، إيماءة، أو نظرة متبادلة. وحتى اليوم، يظل الإنسان الأقدر على قراءة هذه الإشارات الدقيقة التي تعكس عمق التفاعل الاجتماعي.