الذكاء الاصطناعي و”Source Fabrication”.. اختراع المصادر: لماذا يخترع “LLM” مراجع تبدو رسمية؟

AI بالعربي – متابعات

في عصر أصبحت فيه الإجابة الفورية معيارًا للجودة، يبرز تحدٍ خطير في عالم النماذج اللغوية الكبيرة (LLM): ظاهرة “اختراع المصادر” أو Source Fabrication. قد يقدم النموذج مرجعًا يبدو دقيقًا—اسم مجلة علمية، تاريخ نشر، حتى رقم صفحة—لكن عند التحقق، لا وجود له. لماذا يخترع النموذج مراجع تبدو رسمية؟ وهل يفعل ذلك عمدًا أم أنه نتيجة لطبيعة عمله الإحصائية؟ في هذا التحقيق من AI بالعربي – متابعات، نفكك الظاهرة تقنيًا وأخلاقيًا، ونشرح كيف يمكن التعامل معها في بيئات البحث والصحافة والتعليم.

ما المقصود باختراع المصادر؟
اختراع المصادر يحدث عندما يولّد النموذج مرجعًا أكاديميًا أو خبريًا أو كتابًا أو رابطًا غير موجود في الواقع، لكنه مكتوب بصيغة مقنعة جدًا. قد يتضمن:

اسم مؤلف حقيقي لكن دراسة غير موجودة.
عنوان بحث يبدو أكاديميًا لكنه لم يُنشر.
رابطًا إلكترونيًا بصيغة صحيحة يؤدي إلى صفحة خطأ.

المشكلة أن الصياغة تكون متقنة لدرجة يصعب اكتشافها دون تحقق فعلي.

لماذا يحدث ذلك تقنيًا؟
النموذج اللغوي لا “يعرف” المصادر كما يعرفها الإنسان، بل يتنبأ بالكلمة التالية بناءً على أنماط تعلّمها من بيانات التدريب. عندما يُطلب منه “أعطني مرجعًا علميًا”، فإنه يستحضر نمطًا لغويًا لمراجع حقيقية، ثم يركّب مرجعًا جديدًا يطابق هذا النمط إحصائيًا.
بمعنى آخر: هو لا يسترجع دائمًا مرجعًا من قاعدة بيانات حية، بل يولّد نصًا يبدو كمرجع.

هل هذا خطأ أم طبيعة تصميم؟
هو نتيجة مباشرة لطبيعة تصميم النماذج التوليدية. الهدف منها إنتاج نص متماسك ومقنع، وليس التحقق من صحة كل معلومة. إذا لم تكن متصلة بقاعدة بيانات موثوقة أو نظام تحقق خارجي، فإنها قد “تملأ الفراغ” بمعلومة محتملة بدلًا من الاعتراف بعدم المعرفة.

متى يزيد خطر اختراع المصادر؟

عند طلب مراجع دقيقة جدًا في موضوع نادر.
عند السؤال عن أبحاث حديثة جدًا خارج نطاق التدريب.
عند الإصرار على “ضرورة وجود مرجع” حتى لو لم يكن متاحًا.

كلما زادت الضغوط للحصول على إجابة كاملة، زاد احتمال أن يخترع النموذج مصدرًا لإرضاء الطلب.

لماذا تبدو المراجع مقنعة للغاية؟
لأن النموذج تعلّم من آلاف الأنماط الحقيقية لصياغة المراجع: أسماء مجلات، طرق كتابة DOI، تنسيق APA أو MLA. فيستطيع تقليد البنية بدقة، حتى لو كان المحتوى مختلقًا. الشكل صحيح، لكن الجوهر غير موجود.

التأثير على الصحافة والبحث العلمي
في الصحافة، قد يؤدي ذلك إلى نشر معلومة مدعومة بمصدر وهمي، ما يهدد المصداقية. في البحث الأكاديمي، قد يعتمد طالب أو باحث مبتدئ على مرجع غير موجود، ما يسبب أخطاء منهجية جسيمة. لذلك تحذر جامعات عدة من الاعتماد غير المتحقق على مخرجات LLM.

العلاقة بين الهلوسة واختراع المصادر
اختراع المصادر هو شكل خاص من “الهلوسة” (Hallucination)، لكنه أكثر خطورة لأنه يمنح المعلومة المختلقة غطاءً رسميًا. عندما يخترع النموذج رأيًا، يمكن اكتشافه بالمقارنة. أما عندما يخترع مرجعًا، فإنه يوهم القارئ بوجود سند خارجي.

كيف يمكن تقليل الظاهرة؟

استخدام نماذج متصلة ببحث مباشر أو قواعد بيانات موثوقة.
مطالبة النموذج بالاعتراف عند عدم التأكد بدلًا من الإصرار على مرجع.
التحقق اليدوي من كل مرجع قبل النشر أو الاعتماد الأكاديمي.
استخدام أدوات تحقق رقمية للروابط وDOI.

هل الحل في المنع أم في الشفافية؟
الحل ليس منع استخدام النماذج، بل وضع سياسات واضحة:

الإفصاح عن استخدام الذكاء الاصطناعي في إعداد المسودات.
تدريب المستخدمين على التحقق النقدي.
تطوير أنظمة تدمج التوليد مع قواعد بيانات موثقة.

مستقبل المراجع في عصر الذكاء الاصطناعي
قد نشهد انتقالًا من “مرجع مكتوب” إلى “مرجع قابل للتحقق آليًا”، حيث يرتبط كل استشهاد بمعرف رقمي يمكن التأكد منه فورًا. كما قد تصبح خاصية “عدم المعرفة” ميزة مطلوبة في النماذج، بحيث تفضّل قول “لا أعلم” على اختراع معلومة.

الخلاصة: بين الإقناع والحقيقة
النموذج اللغوي مصمم ليكون مقنعًا، لا ليكون أمين مكتبة. اختراع المصادر ليس نية تضليل، بل نتيجة منطق تنبؤي يسعى إلى إكمال النمط. المسؤولية إذن مشتركة: على المطورين تحسين آليات التحقق، وعلى المستخدمين تبني عقلية تدقيق صارمة. في زمن تتضاعف فيه النصوص المولدة، يصبح التحقق من المصدر أهم من جمال الصياغة.