جوجل تحذر: الذكاء الاصطناعي قد يبدو أخلاقيًا لكنه لا يفهم العواقب دائمًا

AI بالعربي – متابعات

في كل مرة تطلب نصيحة طبية من روبوت دردشة، تحصل غالبًا على إجابة طويلة وواثقة. تبدو الإجابة مدروسة ومقنعة. لكن السؤال الأهم يبقى حاضرًا. هل فهم النموذج العواقب فعلًا، أم صادف أنه قدّم ردًا مقبولًا؟

هذه الفجوة بين المظهر والحقيقة هي محور ورقة بحثية جديدة لفريق “جوجل DeepMind” نُشرت في مجلة “Nature”. تركز الورقة على مشكلة دقيقة. نحن نقيس “الأداء الأخلاقي” لا “الفهم الأخلاقي”. نختبر شكل الإجابة. لا نختبر سببها.

لماذا تبدو إجابات الذكاء الاصطناعي أخلاقية؟

يعتمد جزء كبير من تقييم أخلاقيات الذكاء الاصطناعي على سؤال بسيط. هل يعطي إجابة تبدو صحيحة أخلاقيًا؟ هذا النوع من القياس قد ينجح في الاختبارات. لكنه قد يفشل في الحياة الواقعية. السبب واضح. الإجابة الصحيحة لا تعني فهمًا حقيقيًا.

توضح الورقة أن النماذج قد تنتج ردودًا “أخلاقية” لأنها تعلمت أنماط اللغة. تتعلم ما يقوله الناس عادة في مواقف مشابهة. ثم تعيد توليد ذلك بأسلوب مرتب. المشكلة أن هذا لا يضمن إدراكًا للعواقب.

أين تكمن الخطورة عندما تصبح النصيحة قرارًا؟

تستخدم نماذج اللغة الكبيرة في العلاج النفسي. تستخدم أيضًا في الإرشاد الطبي. ويستخدمها بعض الناس للرفقة اليومية. هنا تتحول الكلمات إلى تأثير مباشر. قرار واحد قد يغير سلوك إنسان. وقد يدفعه لخيار صحي خاطئ.

عندما لا نستطيع التمييز بين الفهم والتقليد، يصبح الأمر رهانًا. نضع ثقتنا في “صندوق أسود”. وقد تكون النتائج مؤلمة. وقد تكون مكلفة. وقد تكون غير قابلة للإصلاح.

خارطة طريق لقياس “الكفاءة الأخلاقية”

تقترح “جوجل DeepMind” الانتقال من قياس الأداء إلى قياس الكفاءة. الكفاءة الأخلاقية تعني القدرة على إصدار حكم أخلاقي مبني على اعتبارات فعلية. لا على أنماط إحصائية فقط. وتعرض الورقة خارطة طريق لاختبار هذه الكفاءة.

تركز الخارطة على ثلاثة عوائق رئيسية. وتدعو إلى تصميم اختبارات تكشف كل عائق بوضوح. الهدف ليس إحراج النماذج. الهدف هو فهم حدودها قبل منحها دورًا أكبر.

السبب الأول.. مشكلة التقليد بدل التفكير

تشرح الورقة أن النماذج اللغوية الكبيرة تتنبأ بالكلمة التالية. تعتمد على احتمالات مستخرجة من بيانات تدريب ضخمة. لذلك لا تملك “وحدة تفكير أخلاقي” مستقلة. هي لا تبرر أخلاقيًا كما يفعل الإنسان. هي تولد نصًا مقنعًا.

لهذا قد يقدّم روبوت الدردشة نصيحة أخلاقية ممتازة. وقد يكون السبب مجرد إعادة صياغة لفكرة قديمة. قد تكون الفكرة مأخوذة من نقاشات عامة على الإنترنت. لن يخبرك النص وحده إن كان هناك فهم.

السبب الثاني.. أخلاق متعددة الأبعاد لا يلتقطها الاختبار

لا تقوم الأخلاق الواقعية على معيار واحد. في الحياة اليومية توازن بين الصدق واللطف. توازن أيضًا بين التكلفة والإنصاف. وقد تضطر لاختيار “الأقل ضررًا” لا “الأكثر مثالية”.

الاختبارات التقليدية غالبًا تسأل سؤالًا واحدًا. ثم تنتظر إجابة واحدة. هذا لا يكفي. تغيير تفصيلة واحدة قد يقلب الحكم بالكامل. قد يتغير الحكم بسبب العمر. وقد يتغير بسبب السياق. وقد يتغير بسبب علاقة الأطراف.

تؤكد الورقة أن كثيرًا من التقييمات الحالية لا تتحقق من هذا الفهم. هي لا تسأل النموذج عمّا يهم فعلًا. هي فقط تقيس اتساق النص.

السبب الثالث.. اختلاف الأطر الثقافية والمهنية

تضيف “جوجل DeepMind” طبقة ثالثة من التعقيد. الأخلاق ليست واحدة حول العالم. ما يعد عادلًا في دولة قد يعد غير عادل في أخرى. وكذلك المهن تختلف في قواعدها. الطب له إطار. والعسكر له إطار. والقانون له إطار.

روبوت دردشة يستخدم عالميًا لا يمكنه تقديم “حقائق عامة” فقط. يجب أن يتعامل مع أطر متنافسة. يجب أن يوضح أي إطار يستخدم. ويجب أن يبدل بين الأطر عند الطلب دون تناقض.

تقول الورقة إن هذا الجانب لم يقاس جيدًا حتى الآن. وهو سبب رئيسي في تضخيم الثقة بإجابات تبدو صحيحة فقط.

لماذا لا يكفي أن يحفظ روبوت الدردشة الإجابات؟

تدعو الورقة إلى تغيير طريقة تصميم الاختبارات. بدل أسئلة مألوفة ومتكررة، يقترح الباحثون اختبارات تنافسية تكشف المحاكاة. الفكرة بسيطة. إذا كان النموذج يقلد فقط، فسيتعثر عندما يخرج عن المألوف.

تتضمن إحدى الأفكار سيناريوهات نادرة. تكون سيناريوهات غير مرجح وجودها في بيانات التدريب. هنا يظهر الفرق بين من “يعرف” ومن “يكرر”.

تطرح الورقة أيضًا اختبار تبديل الأطر الأخلاقية. هل يستطيع النموذج الانتقال من أخلاقيات الطب الحيوي إلى قواعد عسكرية؟ هل يقدم إجابات متسقة داخل كل إطار؟ وهل يحافظ على منطقه عند تغييرات بسيطة في السؤال؟

مشكلة الهشاشة.. تغيير صغير قد يعطي نتيجة مختلفة

يعترف الباحثون بصعوبة المهمة. النماذج الحالية قد تكون هشة. تغيير بسيط في صياغة السؤال قد يغير النتيجة. تغيير الترتيب أو التصنيف قد يقود لمسار جديد. وهذا يحدث حتى عندما يبقى المعنى نفسه.

لكن الورقة ترى أن هذا الاختبار ضروري. هو الطريق الوحيد لمعرفة إن كانت النماذج تستحق مسؤولية حقيقية. المسؤولية لا تعني إجابة جيدة فقط. تعني ثباتًا وتفسيرًا ووعيًا بالسياق.

ما الذي تريد “جوجل DeepMind” الوصول إليه؟

تهدف “جوجل DeepMind” إلى وضع معيار علمي جديد. معيار يعطي الكفاءة الأخلاقية وزنًا مشابهًا للمهارات الرياضية. هذا يتطلب تمويلًا لتقييمات عالمية. ويتطلب مراعاة الخصوصيات الثقافية. ويتطلب اختبارات تكشف التقليد بدل مكافأته.

الرسالة الأساسية واضحة. لا تتوقع نجاحًا سريعًا. التقنيات الحالية لم تصل لهذا المستوى بعد. لكن خارطة الطريق تمنح المطورين اتجاهًا محددًا. وتمنح الجهات التنظيمية أساسًا أفضل للتقييم.

ماذا يعني هذا للمستخدم اليوم؟

عندما تطلب نصيحة أخلاقية الآن، قد تحصل على تنبؤ إحصائي. قد لا تحصل على فلسفة حقيقية. قد تبدو الإجابة “مؤثرًا” في أسلوبها، لكنها قد تكون تقليدًا متقنًا فقط.

قد يتغير ذلك مستقبلًا. لكن التغيير يحتاج أدوات قياس جديدة. ويحتاج اختبارات تكشف الفهم. لا مجرد الأداء.