نموذج ذكاء اصطناعي جديد بقدرات متقدمة في فهم العربية
AI بالعربي – متابعات
نجح نموذج “ChatGPT” ونماذج أخرى في أن تجتاح العالم في ثورة الذكاء الاصطناعي.
تستطيع هذه النماذج الإجالة على كل ما يخطر ببالك تقريبا من الأسئلة.
لكن هناك بعض المشاكل، وأهمها الفهم الدقيق للغات والمناطق الجغرافية.
ويظهر هذا بوضوح في اللغة العربية والسياقات الثقافية لمنطقة الشرق الأوسط.
هذا ما تحاول شركة “ميسترال” الفرنسية الناشئة معالجته واكتساب جمهور جديد واسع النطاق في الشرق الأوسط من خلال “فهم الفروق الدقيقة” في المنطقة.
تقول الشركة: “مع انتشار الذكاء الاصطناعي على مستوى العالم، أعرب العديد من عملائنا في جميع أنحاء العالم عن رغبتهم القوية في رؤية نماذج ليست طليقة فحسب بل وأيضا أصلية في اللغات الإقليمية”.
“وفي حين أن النماذج الأكبر حجمًا والأغراض العامة غالبًا ما تكون بارعة في العديد من اللغات، إلا أنها تفتقر إلى الفروق اللغوية والخلفية الثقافية والمعرفة الإقليمية العميقة المطلوبة لخدمة حالات الاستخدام ذات السياق الإقليمي القوي”.
واستطاعت “ميسترال” إطلاق نموذج ميسترال سابا Mistral Saba، المخصص لمنطقة الشرق الأوسط وجنوب آسيا
كيف؟
تعتمد برامج الذكاء الاصطناعي على ما يعرف باسم ماذج اللغة الكبيرة LLM وهي نماذج عميقة كبيرة مدربة مسبقا على معالجة كميات ضخمة من البيانات والربط بينها وفهم العلاقات بين العبارات والكلمات والقدرة على التعلم الذاتي.
وتستخدم النماذج مليارات من المعلمات تمكنها من استيعاب هذه الكميات الهائلة من البيانات،.
النموذج الي استخدمته الشركة الفرنسية للغة العربية يحتوي على 24 مليار معلم (وهو رقم قليل نسبيا) وقد تم تدريبه على مجموعات من البيانات من جميع أنحاء الشرق الأوسط وجنوب آسيا.
وقلة المعلمات تؤدي عمومًا إلى أداء أفضل مع زمن انتقال أقل، ولكن زيادة المعلمات تعني عادة إجابات أكثر ذكاء.
ونموذج “ميسترال سابا” يماثل Mistral Small 3، لكن تجارب الشركة وجدت أن أداء “ميسترال سابا” أفضل بكثير عند التعامل مع المحتوى العربي.
ويمكن استخدام النموذج الجديد في واجهة برمجة التطبيقات.
ومن خلال هذه التقنية يمكن استخدام النموذج “لدعم المحادثة أو إنشاء محتوى باللغة العربية يبدو طبيعا أكثر وذي صلة أكثر”.
“ومن خلال فهم التعبيرات المحلية والمراجع الثقافية، يمكن مساعدة الشركات والمؤسسات على إنشاء محتوى أصيل وجذاب يتردد صداه مع الجماهير في الشرق الأوسط”.
يمكن أن يكون “سابا” خبيرا متخصصا في مجالات مختلفة مثل الطاقة والأسواق المالية والرعاية الصحية، وتقدم رؤى عميقة واستجابات دقيقة في سياق اللغة والثقافة العربية.
كانت الشركة أعلنت مؤخرا أنها ستستثمر مليارات اليورو في بناء مركزها الخاص للبيانات في فرنسا
وميسترال تطمح لأن تصبح اللاعب الأوروبي الرائد في مجال الذكاء الاصطناعي بعدما باتت منافسا لشركات أميركية عملاقة في هذا المجال مثل “OpenAI” التي طورت برنامج “ChatGPT”.
وفي يناير الماضي، بات بإمكان روبوت المحادثة التابع لميسترال واسمه “لو تشات” أن يستخدم النشرات الإخبارية التي تبثّها وكالة فرانس برس بستّ لغات هي الفرنسية والإنكليزية والإسبانية والعربية والألمانية والبرتغالية.