البيانات السطحية تجعل الذكاء الاصطناعي أقل دقة وأكثر عرضة للأخطاء

AI بالعربي – متابعات

حذّر باحثون من أن النماذج اللغوية الكبيرة قد تصبح “أغبى” وأقل دقة عندما تُدرَّب على كميات هائلة من المحتوى منخفض الجودة المنتشر عبر شبكات التواصل الاجتماعي، وفقًا لتقرير نشرته “روسيا اليوم”.

تفاصيل الدراسة وتحليل البيانات

بحسب دراسة حديثة نُشرت على خادم الأبحاث “arXiv” ونقلتها مجلة “Nature”، قام فريق من جامعة تكساس في أوستن بتحليل تأثير البيانات “غير المفيدة” — مثل المنشورات السطحية والمحتوى الترفيهي المكرر — على أداء أنظمة الذكاء الاصطناعي.

وركّز البحث على عدة جوانب تشمل المنطق، والاستدلال، واستخراج المعلومات من النصوص الطويلة، بالإضافة إلى الأخلاقيات والسمات الشخصية للنماذج اللغوية.

نتائج مثيرة للقلق

أظهرت نتائج الدراسة أنه كلما زادت نسبة البيانات الرديئة في عملية التدريب، ارتفعت معدلات الخطأ لدى النماذج وتراجع أداؤها في اختبارات التفكير والتحليل.

وأشار الباحث الرئيسي “تشانغيانغ وانغ” إلى المبدأ الكلاسيكي في علوم الذكاء الاصطناعي قائلاً: “القمامة في المدخلات تعطي قمامة في المخرجات”.

تأثير سلبي على النماذج الشهيرة

استخدم العلماء مليون منشور من منصة تواصل اجتماعي شهيرة لإعادة تدريب النموذجين المفتوحين “Llama 3″ و”Qwen”.

وأظهر التحليل أن نموذج “Llama” تغيّر سلوكه بشكل واضح بعد تدريبه على بيانات منخفضة الجودة، حيث تراجعت سماته “الإيجابية” وظهرت أخرى “سلبية” مثل النرجسية والاعتلال النفسي.

محاولات محدودة للإصلاح

رغم أن محاولات تحسين الأداء من خلال إعادة التدريب على بيانات عالية الجودة أو تعديل التعليمات حسّنت النتائج جزئيًا، فإن مشكلات التفكير المنطقي وتخطي الخطوات التحليلية ظلت قائمة.

أهمية انتقاء البيانات في المستقبل

أكد الباحثون أن هذه النتائج تسلط الضوء على ضرورة انتقاء البيانات بعناية عند تدريب أنظمة الذكاء الاصطناعي، خاصة في ظل توجّه منصات التواصل الاجتماعي إلى استغلال بيانات المستخدمين في تطوير النماذج التوليدية.

فعلى سبيل المثال، تعتزم شركة “LinkedIn” بدءًا من نوفمبر الجاري استخدام بيانات المستخدمين الأوروبيين في أنظمة الذكاء الاصطناعي الخاصة بها، ما يثير جدلًا واسعًا حول جودة المحتوى المستخدم وتأثيره على أداء النماذج مستقبلاً.

  • Related Posts

    “مايكروسوفت” تكشف عن “MAI-Image-1” أول مولد صور مطوّر داخليًا بتقنية الذكاء الاصطناعي

    AI بالعربي – متابعات كشفت شركة مايكروسوفت عن نموذجها الجديد لتوليد الصور بالذكاء الاصطناعي “MAI-Image-1″، ليكون أول نموذج من تطويرها الداخلي بالكامل، ويُعد خطوة رئيسية ضمن خطتها لتقليل اعتمادها على…

    “بيربلكسي” ترد على أمازون بعد اتهامات بإيقاف مساعدها الذكي “كوميت”

    AI بالعربي – متابعات نشب خلاف علني بين شركتي “أمازون” و”بيربلكسي” بعد أن طلبت أمازون رسميًا من الأخيرة إيقاف مساعدها الذكي “Comet”، متهمةً إياها بانتهاك شروط استخدام منصتها، في واقعة…

    اترك تعليقاً

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    مقالات

    “تنانين الذكاء الاصطناعي” في الصين وغزو العالم

    • أكتوبر 30, 2025
    • 87 views
    “تنانين الذكاء الاصطناعي” في الصين وغزو العالم

    الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

    • أكتوبر 12, 2025
    • 240 views
    الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

    حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

    • أكتوبر 1, 2025
    • 331 views
    حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

    الإعلام.. و”حُثالة الذكاء الاصطناعي”

    • سبتمبر 29, 2025
    • 339 views
    الإعلام.. و”حُثالة الذكاء الاصطناعي”

    تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

    • سبتمبر 26, 2025
    • 292 views
    تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

    كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟

    • سبتمبر 24, 2025
    • 330 views
    كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟