الذكاء الاصطناعي والعربية.. كيف تخدم الخوارزمية لغة "الضاد"؟ | AI بالعربي

AI بالعربي – متابعات

تبدو المسألة واضحة، لكنها لا تزال جزءًا من جهد مستمر يتم تطويره. يمكن للذكاء الاصطناعي، وما يقدمه لنا يوميًا من ابتكارات، أن يفتح أمامنا آفاقًا واسعة. نحن، كمستخدمين، لا ننكر أبدًا – وليس من المبالغة إن شملنا المتخصصين – انبهارنا المتزايد وذهول عقولنا من تقنيات هذه الأداة الذكية.

لكن في حرم لغة الضاد “العربية” يقف الكل مترقِّبًا كيف يتعامل الذكاء الاصطناعي مع مفردات لغة تزيد على 12 مليون كلمة ما يعادل 25 ضعفًا من عدد كلمات الإنجليزية بحسب المصادر والمراجع والمعاجم اللغوية.

“العربية” بين أصعب وأسهل اللغات في التعلُّم البشري

تُعد اللغات الآسيوية مثل الصينية والكورية واليابانية من أصعب اللغات عالميًا. وتتميز اللغة الصينية بنظام رموز ضخم يحتوي على آلاف الأحرف، ما يجعل تعلمها يتطلب معرفة حوالي 3 آلاف رمز للقراءة الأساسية. أما الكورية، فهي لغة “منعزلة” تعتمد على نظام كتابة خاص يُعرف بـ”الهانغول”، يجمع بين الرموز الصينية والتراكيب الفريدة. في حين تتسم اليابانية بتعقيد نظام كتابتها، الذي يشمل “هيراغانا” و”كاتاكانا”، بجانب آلاف الرموز متعددة المعاني، مما يتطلب جهدًا كبيرًا لإتقانها.

على صعيد آخر، تشتهر العربية، والروسية، واللغات الأوروبية مثل الهنغارية، والأيسلندية، والفنلندية بصعوبتها. وتتميز العربية بأصوات ونظام نحوي فريد، بينما تعتمد الروسية على أبجدية غير مألوفة وتحتاج دقة في النطق. أما الهنغارية والأيسلندية فتحتويان على قواعد نحوية معقدة، ويُضاف إلى الفنلندية تحديات الترجمة الدقيقة؛ إذ يمكن أن يغير السياق معاني الكلمات كليًا.

الذكاء الاصطناعي وتعلم اللغات

يشهد الذكاء الاصطناعي تطورًا مذهلًا في مجالات متعددة، منها تسهيل تعلم اللغات. وتعتمد تقنيات الذكاء الاصطناعي على واجهات محادثة شفهية أو مكتوبة، مثل “أليكسا” و”سيري” – مثلاً – التي تتيح للمستخدمين التفاعل اللغوي بطريقة تلقائية. ومع ذلك، فإن القدرة على استبدال المعلمين الحقيقيين لا تزال تواجه تحديات كبيرة؛ أبرزها نقص الإبداع والوعي المعرفي الذي يُمكّن البشر من التفاعل بشكل مرن وفق السياق. والتطبيقات التعليمية، مثل “دولينغو”، تستفيد من خوارزميات بسيطة لتقديم تدريبات تفاعلية، لكنها تواجه صعوبة في تقديم تغذية راجعة عميقة أو تصحيح النطق بشكل دقيق.

رغم التطورات الملحوظة، فإن أنظمة التعلم التفاعلية ما زالت محدودة ببرامج مُصممة مسبقًا، مما يجعلها مناسبة للمبتدئين أكثر من المتعلمين المتقدمين. وتستخدم هذه الأنظمة بيانات واسعة النطاق لتحسين تجربة المستخدم، مثل تحليل الترجمة أو تقديم محتوى مستند إلى أمثلة حقيقية. ومع ذلك، تظل الاستفادة محصورة في سيناريوهات محددة، ولا تستطيع أن تضاهي التفاعل البشري الذي يعتمد على معرفة اجتماعية وثقافية غنية. ومن ثَمَّ، يمكن أن تسد الفجوة في حالات عدم توفر التعليم التقليدي، مثل دعم اللاجئين لتعلم المفردات الأساسية.

في حين تعد تقنيات الذكاء الاصطناعي أداة مبتكرة، فإنها تُستخدم كعنصر تكميلي بدلاً من كونها بديلًا عن المعلمين الحقيقيين. وقد تؤدي هذه الأنظمة دورًا حيويًا في تعلم المهارات الأساسية أو ممارسة اللغة في أوقات الفراغ، إلا أن التعليم الفعلي يظل قائمًا على التفاعل البشري في بيئة تعلّم اجتماعية. والتحدي الحقيقي يكمن في تحقيق التوازن بين التعليم الإلكتروني ودروس المعلمين، لتقديم تجربة تعليمية شاملة وفعالة.

دور الذكاء الاصطناعي في تعلم اللغة

يشكل الذكاء الاصطناعي جزءًا محوريًا من حياة الإنسان في القرن الحادي والعشرين، وقد بدأ تأثيره يمتد إلى مختلف جوانب التعليم، بما في ذلك تعلم اللغات. ويُظهر الذكاء الاصطناعي إمكانيات هائلة لتحسين النظام التعليمي من خلال تقديم محتوى ذكي يتماشى مع احتياجات الطلاب الفردية، وزيادة قدرة المؤسسات التعليمية على المنافسة، بالإضافة إلى تمكين المعلمين والطلاب. إلا أن هذا التقدم يرافقه العديد من التساؤلات والمخاوف بشأن تأثير التكنولوجيا على الجوانب الإنسانية في عملية التعلم.

تناولت دراسة بعنوان: “Artificial Intelligence in Language Learning What Are We Afraid of” المنشورة في مجلة World English Journal (AWEJ)، العدد الثامن، في يوليو 2022، هذه المخاوف. وأُجريت الدراسة عام 2021 على طلاب جامعيين من أوكرانيا، تحديدًا من جامعة كييف الوطنية للتجارة والاقتصاد وجامعة جيتومير إيفان فرانكو الحكومية، وشارك فيها 418 طالبًا. أشارت نتائج الدراسة إلى مستوى عالٍ جدًا من إدراك الطلاب (83-100%) لدور الذكاء الاصطناعي في تعلم اللغة. لكن، في المقابل، عبّر الطلاب عن مخاوف تتعلق بالهجمات السيبرانية على حساباتهم الشخصية المستقبلية واحتمالية فقدان بياناتهم الخاصة.

بالإضافة إلى ذلك، أظهرت الدراسة أن الطلاب يشعرون بالقلق من تأثير الذكاء الاصطناعي على البيئة الطبيعية للتواصل مع المتحدثين الأصليين، معتبرين أن فقدان التواصل العاطفي الحقيقي يمثل تحديًا كبيرًا. كما قيّمت الدراسة مشكلة نقص العفوية والإبداع لدى المتعلمين عند استخدام الذكاء الاصطناعي، حيث أظهرت نسبة مرتفعة تصل إلى 98% من المتعلمين يعانون غياب هذه السمات الأساسية.

وفي ختام الدراسة، أُشير إلى أن الذكاء الاصطناعي، رغم قدرته الكبيرة على تحسين عملية التعلم، فإنه لا يمكن أن يحل محل التجربة الإنسانية الطبيعية بكل تعقيداتها ومكوناتها. لذا، ينبغي النظر إليه كأداة مساعدة وليست بديلاً كاملاً للعنصر البشري في تعلم اللغات.

لكنَّها كيف تخدم اللغة العربية؟

استهدفت دراسة بعنوان: Artificial Intelligence Development and Challenges (Arabic Language as a Model)، الحديث عن تطور وتحديات الذكاء الاصطناعي باستخدام اللغة العربية يتناول مجالًا حيويًا ومهمًا، حيث يُعرَّف الذكاء الاصطناعي بأنه قدرة الأنظمة الحاسوبية على معالجة البيانات بطريقة تُمكنها من الوصول إلى نتائج تحاكي التفكير البشري، مثل التعلم واتخاذ القرارات. ويبرز التحدي الأكبر هنا في قلة الاعتماد على اللغة العربية ضمن هذا المجال مقارنة بحجم استخدامها عالميًا. فعلى الرغم من أن اللغة العربية يتحدث بها حوالي 5% من سكان العالم، فإن نسبة المحتوى العربي على الإنترنت لا تتجاوز 1%.

بحسب هذه الورقة العلمية التي تم نشرها، منذ عام 2020، عبر مجلة International Journal of Innovation, Creativity and Change، هذا الفارق الشاسع يعكس مشكلات متعددة، منها تأخر إدراك أهمية استخدام الذكاء الاصطناعي في تطوير الترجمة الآلية وتعزيز اللغة العربية رقميًا. كذلك، يفتقر هذا المجال إلى عدد كافٍ من الخبراء والباحثين المتخصصين الذين يمكنهم تطوير تقنيات الذكاء الاصطناعي وتحسين أدائها للتعامل مع اللغة العربية.

ماذا عن الترجمة؟

أكد العديد من الباحثين أن الترجمة الآلية العصبية (NMT) والتكنولوجيا ستؤديان دورًا أساسيًا في مستقبل المترجمين واللغويين. وأحد المفاهيم الحديثة في هذا المجال هو “الترجمة المعززة”، الذي طوره فريق استشاري في ماساتشوستس بالولايات المتحدة. يهدف هذا المفهوم إلى تسهيل وصول المترجمين إلى المعلومات ذات الصلة وجعلها في متناول اليد، حيث يتم تطبيق تقنيات متعددة مثل ذاكرة الترجمة وإدارة المصطلحات.

باستخدام الترجمة المعززة، سيتمكن المترجمون من الاستفادة من الترجمة الآلية العصبية التكيفية والمحتوى الآلي، مما يتيح لهم الوصول السريع إلى المعلومات اللازمة خلال عملية الترجمة دون الحاجة إلى الرجوع إلى القواميس المختلفة أو الترجمات السابقة للكلمات. كما أن اقتراحات نظام الترجمة الآلية العصبية ستتأثر بخبرة المترجم وتدخله المباشر في العملية.

بالإضافة إلى ذلك، فإن جودة المخرجات تعتمد على خبرة المترجم ومعرفته العميقة باللغة المصدر واللغة المستهدفة وكذلك السياق. ومع ذلك، يواجه المترجم تحديات عديدة خلال عملية الترجمة، مثل: المشكلات المتعلقة بالمعاني والمفردات، والقواعد النحوية، والتراكيب اللغوية، والاستخدام البراغماتي، والفروقات الثقافية. كما أن طبيعة النص نفسه تؤدي دورًا مهمًا في الترجمة، حيث تختلف المقاربة بناءً على نوع النصوص مثل التعابير الاصطلاحية، والسياسية، والاقتصادية، والعلمية، وغيرها.

أنظمة ذكاء اصطناعي تحليلية

تركز الورقة على أهمية تطوير أنظمة ذكاء اصطناعي قادرة على حل مشكلات معقدة تتطلب قدرة تحليلية مشابهة للإنسان. وقدمت أمثلة من دراسات وورش عمل تسلط الضوء على التطورات والتحديات التي تواجه توظيف الذكاء الاصطناعي في اللغة العربية. كما تناولت دور معالجة اللغة الطبيعية (NLP)، وهي تقنية تساعد على تحليل وفهم النصوص اللغوية باستخدام الحواسيب، مما يُعد خطوة هامة نحو تحسين استيعاب الذكاء الاصطناعي للغة العربية ورفع مستوى استخدامه في التطبيقات اليومية.

“علَّام” النموذج العربي ونشر ثقافة لغة الضاد

تم تطوير نموذج “علّام” التوليدي للغة العربية من قبل المملكة العربية السعودية عبر منصة “سدايا”، ليشكل خطوة هامة نحو تعزيز اللغة العربية في مجال الذكاء الاصطناعي التوليدي. هذا النموذج، الذي تم تطويره بمواصفات عالية، يسهم في تمكين المحتوى العربي عبر مجموعة واسعة من المجالات مثل: التقنية، والثقافة، والعلم، مما يعكس التزام المملكة بنشر اللغة العربية وتطويرها لتواكب أحدث التقنيات العالمية. وقد تم تدريبه على أكبر مجموعات البيانات باللغة العربية والإنجليزية، مما يجعله قادرًا على معالجة الاستفسارات بشكل نصي أو صوتي، ليقدم حلولًا مبتكرة للمستخدمين في مختلف أنحاء العالم.

يعد هذا النموذج جزءًا من جهود المملكة في تحقيق أهداف رؤية السعودية 2030، التي تهدف إلى جعل المملكة مركزًا عالميًا للتقنيات المتقدمة والذكاء الاصطناعي. ويعكس التعاون بين “سدايا” وشركة IBM في تطوير نموذج “علّام” خطوة استراتيجية في تعزيز مكانة المملكة في السوق العالمي. من خلال هذا النموذج، تسعى المملكة إلى تعزيز التنوع الثقافي في استخدام تقنيات الذكاء الاصطناعي، مما يعكس التزامها بدعم اللغة العربية وتلبية احتياجات السوق الإقليمي والعالمي.

توصيات في اللغة الذكية والمفردات

لم تنسَ الدراسة، المنشورة عبر مجلة International Journal of Innovation, Creativity and Change، أن تضع توصيات للتعامل مع نمذجة اللغة العربية الذكية، وذلك كما يلي:

1- العمل بجد وتطوير التقنيات المستخدمة لتمثيل الدلالة المعنوية للنصوص، خاصة مع استكشاف تقنيات جديدة وعميقة مثل Word2Vec و InferSent وVSE وElmo.

2- تدريب المتصفحات لتحقيق أفضل أداء في مهام اللغة العربية وتعزيز مستوى الجمل، الذي لا يزال لا يُستخدم بشكل صحيح. ومع ذلك، هناك إمكانيات لاستخدام هذا التمثيل المتعلق بوحدات أخرى في معالجة اللغات الطبيعية مثل: وحدة الهيكل، ووحدة أجزاء الكلام، ووحدة التحليل النحوي، ووحدة دقة الاستبيان.

3- دعم التكنولوجيا اللغوية لنشر جميع أنواع المعرفة اللغوية وتسهيل استخدامها. يمكن أن يسهم ذلك في تعزيز التعرف على البناء العلمي والنظريات اللغوية بين مستخدمي اللغة العربية.

4- دعم التخطيط اللغوي من خلال إصلاح بنية اللغة ونظام الصوتيات ووظائفها، وتقليل قواعد الكتابة، وإنشاء القواميس، وحماية مفردات اللغة العربية، وتحديثها ومشاركتها مع المجتمعات الناطقة الأخرى.

5- دعم السياسات اللغوية من خلال اتخاذ قرارات بين اللغة والعلم في عملية اكتساب اللغة.

6- اللغة البشرية ظاهرة معقدة جدًا، لذلك من الضروري الاعتماد على نماذج لغوية لحل المشكلات المعقدة. يجب أن نكون منفتحين على العلوم الأخرى لحل هذه المشكلات. بالإضافة إلى ذلك، يجب استخدام الخوارزميات لتوظيف اللغة في خدماتها.

7- هناك حاجة إلى تعاون حقيقي بين علماء الذكاء الاصطناعي واللغويين؛ لأن اللغة تتطلب جهدًا إنسانيًا كبيرًا.

في الختام، تبقى اللغة العربية ذات طابع خاص، كما أنَّ لكل لغة خُصوصيتها، ولا يسعنا إلَّا أن نُنبِّه إلى ضرورة أن تسترعي العقول الانتباه في التعامل مع نماذج الأداة التقنية، التي ما زالت تخضع لتدريبات بذكاء اصناعي في خِضَمِّ أبحر من اللغات، من بينها لغة حيَّة هي لغة “الضاد”.