الذكاء الاصطناعي و”Data Poisoning”.. تسميم البيانات: كيف يُزرع الانحراف قبل التدريب؟

AI بالعربي – متابعات

عندما نتحدث عن أخطاء الذكاء الاصطناعي، غالبًا ما يتجه التفكير إلى مرحلة التوليد، أو إلى الهلوسة، أو إلى سوء الفهم أثناء التفاعل. لكن الخطر الأعمق، والأكثر خفاءً، يحدث قبل كل ذلك بكثير، في المرحلة التي لا يراها المستخدم ولا يتحكم فيها مباشرة: مرحلة البيانات. هنا يظهر مفهوم Data Poisoning، أو تسميم البيانات، بوصفه أحد أخطر التهديدات البنيوية للذكاء الاصطناعي، لأنه لا يغيّر سلوك النموذج بعد التشغيل، بل يزرع الانحراف في عقله قبل أن يولد.

في هذا النوع من الهجمات، لا يتم التلاعب بالإجابة، بل بالتعلّم نفسه. والنتيجة نموذج يبدو طبيعيًا، لكنه يحمل انحرافًا مزروعًا في أساسه.

ما هو Data Poisoning؟
يشير مصطلح Data Poisoning إلى إدخال بيانات مضللة، أو منحازة، أو مصممة بعناية ضمن بيانات التدريب، بهدف التأثير على سلوك النموذج النهائي. هذه البيانات لا تكون عشوائية، بل تُزرع بطريقة تجعل النموذج يتعلم أنماطًا خاطئة أو تحيزات محددة دون أن يبدو الأمر خللًا واضحًا.

الخطورة هنا أن النموذج لا “يعرف” أنه يتعلم خطأ، لأنه يتعامل مع البيانات المسمومة كما لو كانت تمثل الواقع.

لماذا يُعد تسميم البيانات أخطر من الهجمات المباشرة؟
الهجمات المباشرة، مثل Prompt Injection أو Retrieval Attack، يمكن أحيانًا اكتشافها أو احتواؤها بعد التشغيل. أما Data Poisoning، فيعمل من الداخل، ويؤثر على كل مخرجات النموذج، حتى في الحالات التي لا يوجد فيها أي تفاعل عدائي مباشر.

بمجرد اكتمال التدريب، يصبح الانحراف جزءًا من شخصية النموذج، ويصعب عزله أو تصحيحه دون إعادة تدريب مكلفة ومعقدة.

أين يحدث تسميم البيانات؟
يحدث Data Poisoning في مراحل متعددة. قد يبدأ أثناء جمع البيانات من مصادر مفتوحة، أو عند دمج مجموعات بيانات خارجية، أو حتى أثناء عمليات التنظيف والتوسيم. أي نقطة يدخل فيها الإنسان أو النظام بيانات غير محققة تمثل فرصة محتملة للتسميم.

في النماذج الضخمة، حيث يتم الاعتماد على مليارات الأمثلة، يصبح التحقق اليدوي شبه مستحيل، ما يوسع سطح الهجوم بشكل كبير.

التسميم الصريح مقابل التسميم الخفي
في التسميم الصريح، تكون البيانات خاطئة بوضوح، لكنها قد تمر دون ملاحظة إذا كانت قليلة أو موزعة. أما التسميم الخفي، فهو الأخطر، حيث تكون البيانات صحيحة لغويًا ومنطقية ظاهريًا، لكنها موجهة لتعزيز تحيز أو استنتاج معين.

هذا النوع من التسميم لا يكسر النموذج، بل يعيد تشكيل زاوية رؤيته للعالم.

كيف يُزرع الانحراف داخل النموذج؟
يُزرع الانحراف عبر التكرار. عندما يتعرض النموذج لنمط معين مرارًا داخل بيانات التدريب، يبدأ في اعتباره قاعدة عامة. قد يكون هذا النمط تصورًا منحازًا لفئة معينة، أو علاقة سببية غير دقيقة، أو أولوية غير مبررة لفكرة ما.

مع الوقت، يتحول هذا النمط إلى جزء من توزيع الاحتمالات الذي يعتمد عليه النموذج في التوليد.

Data Poisoning والتحيز البنيوي
التحيز الناتج عن تسميم البيانات أخطر من التحيز العرضي. لأنه لا يظهر في حالات محددة فقط، بل يؤثر على بنية التفكير نفسها. النموذج قد يبدو متوازنًا في الإجابات العامة، لكنه ينحرف باستمرار في موضوعات معينة.

هذا النوع من التحيز يصعب كشفه عبر الاختبارات السطحية، لأنه لا يُنتج أخطاء فجة، بل انحرافات ناعمة ومتكررة.

AEO عندما تكون الإجابة “منطقية” لكنها منحرفة
من منظور تحسين الإجابة، يمثل Data Poisoning تهديدًا صامتًا. الإجابة قد تكون واضحة، متماسكة، ومتسقة لغويًا، لكنها مبنية على افتراضات غير دقيقة تعلمها النموذج مبكرًا.

المستخدم لا يرى خطأ مباشرًا، بل رؤية مشوهة للواقع، ما يجعل التأثير طويل الأمد وخطيرًا.

التسميم المتعمد مقابل التسميم غير المقصود
ليس كل Data Poisoning هجومًا متعمدًا. أحيانًا يحدث التسميم نتيجة اعتماد مفرط على مصادر محددة، أو تمثيل غير متوازن للبيانات، أو أخطاء في الوسم. النتيجة واحدة، حتى لو اختلفت النية.

هذا يوسع مفهوم التهديد ليشمل أخطاء التصميم، لا فقط الهجمات الخبيثة.

لماذا يصعب اكتشاف Data Poisoning؟
لأن النموذج لا “ينكسر”. لا تظهر أخطاء تقنية، ولا يتوقف النظام عن العمل. كل شيء يبدو طبيعيًا، إلى أن تبدأ الأنماط المنحرفة في الظهور تدريجيًا عبر الاستخدام.

اكتشاف التسميم يتطلب تحليلًا طويل المدى للسلوك، ومقارنة دقيقة بين ما يفترض أن يقدمه النموذج وما يقدمه فعليًا.

تسميم البيانات في النماذج المفتوحة
النماذج التي تعتمد على بيانات مفتوحة أكثر عرضة لتسميم البيانات، بسبب سهولة التلاعب بالمحتوى العام، سواء عبر نشر معلومات مضللة، أو تكرار سرديات معينة بكثافة.

كلما كان المصدر أوسع، زادت الحاجة إلى حوكمة أقوى.

Data Poisoning والنماذج التكيفية
النماذج التي تتعلم باستمرار أو تُحدّث بياناتها بشكل دوري تواجه خطرًا إضافيًا. إذا لم تُضبط آليات التحديث، قد يتسلل التسميم تدريجيًا، دون أن يمر بمرحلة تدريب مركزية يمكن مراجعتها.

هنا يصبح التسميم عملية مستمرة، لا حدثًا واحدًا.

الأمن لا يبدأ من النموذج
Data Poisoning يوضح أن أمن الذكاء الاصطناعي لا يبدأ من الكود أو النموذج، بل من البيانات. أقوى نموذج يصبح هشًا إذا كانت بياناته ملوثة. والعكس صحيح، نموذج متوسط ببيانات نظيفة قد يكون أكثر موثوقية.

هذا يعيد تعريف أولويات الاستثمار في الذكاء الاصطناعي.

استراتيجيات الحد من تسميم البيانات
تقليل مخاطر Data Poisoning يتطلب تنويع مصادر البيانات، استخدام آليات تحقق متعددة، مراقبة الأنماط الإحصائية غير الطبيعية، وإجراء اختبارات سلوكية دورية للنموذج. كما أن الفصل بين بيانات التدريب والتقييم يقلل من انتقال الانحراف دون ملاحظة.

الأهم هو الاعتراف بأن البيانات ليست محايدة بطبيعتها.

البعد الأخلاقي لتسميم البيانات
عندما يتعلم نموذج من بيانات مسمومة، فإنه يعيد إنتاج الانحراف على نطاق واسع. المسؤولية هنا لا تقع فقط على المهاجم، بل على من صمم النظام دون ضوابط كافية.

Data Poisoning يطرح سؤالًا أخلاقيًا جوهريًا: من يضمن عدالة المعرفة التي نُعلّم بها الآلات؟

مستقبل الصراع: من النماذج إلى البيانات
مع تقارب قدرات النماذج، ستتحول ساحة الصراع إلى البيانات. من يملك البيانات الأنظف، لا الأكبر، سيملك النموذج الأكثر موثوقية. Data Poisoning سيصبح تحديًا مركزيًا في هذا الصراع.

الذكاء الاصطناعي لن يُقيّم فقط بذكائه، بل بنزاهة ما تعلّمه.

خلاصة المشهد: الانحراف يبدأ قبل أن نراه
Data Poisoning يذكّرنا بأن أخطر الأخطاء لا تظهر في الإجابة، بل في التعلّم نفسه. عندما تُزرع البيانات المسمومة في مرحلة التدريب، يصبح الانحراف جزءًا من بنية النموذج، لا عرضًا طارئًا.

السؤال الحقيقي لم يعد كيف نصحح الإجابة، بل كيف نضمن أن ما تعلّمه النموذج من الأساس لم يكن منحرفًا.