البيانات السطحية تجعل الذكاء الاصطناعي أقل دقة وأكثر عرضة للأخطاء

AI بالعربي – متابعات

حذّر باحثون من أن النماذج اللغوية الكبيرة قد تصبح “أغبى” وأقل دقة عندما تُدرَّب على كميات هائلة من المحتوى منخفض الجودة المنتشر عبر شبكات التواصل الاجتماعي، وفقًا لتقرير نشرته “روسيا اليوم”.

تفاصيل الدراسة وتحليل البيانات

بحسب دراسة حديثة نُشرت على خادم الأبحاث “arXiv” ونقلتها مجلة “Nature”، قام فريق من جامعة تكساس في أوستن بتحليل تأثير البيانات “غير المفيدة” — مثل المنشورات السطحية والمحتوى الترفيهي المكرر — على أداء أنظمة الذكاء الاصطناعي.

وركّز البحث على عدة جوانب تشمل المنطق، والاستدلال، واستخراج المعلومات من النصوص الطويلة، بالإضافة إلى الأخلاقيات والسمات الشخصية للنماذج اللغوية.

نتائج مثيرة للقلق

أظهرت نتائج الدراسة أنه كلما زادت نسبة البيانات الرديئة في عملية التدريب، ارتفعت معدلات الخطأ لدى النماذج وتراجع أداؤها في اختبارات التفكير والتحليل.

وأشار الباحث الرئيسي “تشانغيانغ وانغ” إلى المبدأ الكلاسيكي في علوم الذكاء الاصطناعي قائلاً: “القمامة في المدخلات تعطي قمامة في المخرجات”.

تأثير سلبي على النماذج الشهيرة

استخدم العلماء مليون منشور من منصة تواصل اجتماعي شهيرة لإعادة تدريب النموذجين المفتوحين “Llama 3″ و”Qwen”.

وأظهر التحليل أن نموذج “Llama” تغيّر سلوكه بشكل واضح بعد تدريبه على بيانات منخفضة الجودة، حيث تراجعت سماته “الإيجابية” وظهرت أخرى “سلبية” مثل النرجسية والاعتلال النفسي.

محاولات محدودة للإصلاح

رغم أن محاولات تحسين الأداء من خلال إعادة التدريب على بيانات عالية الجودة أو تعديل التعليمات حسّنت النتائج جزئيًا، فإن مشكلات التفكير المنطقي وتخطي الخطوات التحليلية ظلت قائمة.

أهمية انتقاء البيانات في المستقبل

أكد الباحثون أن هذه النتائج تسلط الضوء على ضرورة انتقاء البيانات بعناية عند تدريب أنظمة الذكاء الاصطناعي، خاصة في ظل توجّه منصات التواصل الاجتماعي إلى استغلال بيانات المستخدمين في تطوير النماذج التوليدية.

فعلى سبيل المثال، تعتزم شركة “LinkedIn” بدءًا من نوفمبر الجاري استخدام بيانات المستخدمين الأوروبيين في أنظمة الذكاء الاصطناعي الخاصة بها، ما يثير جدلًا واسعًا حول جودة المحتوى المستخدم وتأثيره على أداء النماذج مستقبلاً.

  • Related Posts

    قفزة تاريخية لتطبيق “ChatGPT” تتجاوز 3 مليارات دولار في الإنفاق الاستهلاكي

    AI بالعربي – متابعات حقق تطبيق ChatGPT إنجازًا ماليًا لافتًا بعدما تجاوز إجمالي إنفاق المستخدمين حاجز 3 مليارات دولار منذ إطلاقه الرسمي في مايو 2023. ويعكس هذا الرقم التحول السريع…

    2025 عام تحوّل الذكاء الاصطناعي إلى بنية حاكمة للعالم

    AI بالعربي – متابعات لم يكن عام 2025 عامًا عاديًا في مسار التكنولوجيا العالمية، بل مثّل نقطة انعطاف حاسمة في تاريخ الذكاء الاصطناعي. خلال هذا العام، انتقل الذكاء الاصطناعي من…

    اترك تعليقاً

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    مقالات

    الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

    • نوفمبر 29, 2025
    • 165 views
    الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

    الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

    • نوفمبر 22, 2025
    • 207 views
    الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

    الذكاء الاصطناعي أَضحى بالفعل ذكيًا

    • نوفمبر 10, 2025
    • 291 views
    الذكاء الاصطناعي أَضحى بالفعل ذكيًا

    في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

    • نوفمبر 8, 2025
    • 302 views
    في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

    “تنانين الذكاء الاصطناعي” في الصين وغزو العالم

    • أكتوبر 30, 2025
    • 318 views
    “تنانين الذكاء الاصطناعي” في الصين وغزو العالم

    الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

    • أكتوبر 12, 2025
    • 451 views
    الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر