تحديات استخدام روبوت المحادثة على محركات البحث

57

فيكتور بوتيف

قد تظهر نماذج خاصة باللغات الكبيرة (LLMs) مثل روبوتات المحادثة ChatGPT  باعتبارها مكملة لمحركات البحث، إلا أنه لا تزال ثمة بعض العوائق التي ينبغي أخذها في الاعتبار. فبعد عملية إطلاق روبوت المحادثة، أخيرًا، في شهر نوفمبر 2022، شعرت الشركات الكبيرة بانبهار تجاه فكرة بناء الذكاء الاصطناعي في أنظمتها.

إذ قادت شركتا “ميكروسوفت” Microsoft و”جوجل” Google مبادرة بالإعلان عن تحركاتهما لبناء نماذج مثل روبوتات “جي بي تي 3″ GPT-3 و”بارد” Bard في محركات البحث الخاصة بهما، وهو ما يتيح إمكانية تقديم ردود واستجابات سياقية وإنسانية على الاستفسارات. كما أنه من المحتمل أن تحذو المزيد من الشركات حذوهما في هذا المسار، حيث يتم بالفعل تنفيذ نماذج لغوية مشابهة على محركات البحث. وكانت هذه النماذج، التي تضم “جي بي تي -3” ضمن فئاتها، قد استحوذت على جزء كبير من عالم التكنولوجيا من خلال قدرتها على محاكاة وتفسير الأنماط البشرية في الكلام والكتابة.

وباعتبارها مدربة على التعامل مع كميات هائلة من البيانات من خلال المصادر العديدة على الإنترنت وتتبع المليارات من المعلومات، فقد بات بالإمكان أن تتلقى هذه النماذج مسائل دقيقة تتعلق بالكلام البشري. وبالتالي، فإن هذه النماذج لديها القدرة على تفسير التعبيرات العامية والنصوص الفرعية والأسئلة الدقيقة، وإنتاج مخرجات غنية بنفس القدر كما تبدو لنا.

ومع ذلك، فبينما يمكن أن تفهم هذه النماذج الكبيرة لغة طبيعية وتنتجها، فإن ذلك لا يترتب عليه أنها تنتج بشكل طبيعي قيمة معينة بالنسبة للعديد من المؤسسات في الوقت الحالي. وبدلاً من ذلك، غالبًا ما تجعل حجم نماذج البيانات الكبيرة، غير مناسبة بالنسبة لأي عمل في المجالات التي تكون فيها الدقة الواقعية هي الشغل الشاغل. كما أنها تتضمن العديد من استفسارات البحث عبر الإنترنت.

ولا تعمل نماذج اللغات بشكل جيد في المجالات التي تتطلب معرفة متخصصة. وفي الواقع، فإنها لا تقوم بعمل جيد على الإطلاق في أي دور مدر للدخل حيث تكون الموثوقية الواقعية مطلوبة. وهنا يثار التساؤل: لماذا يكون الأمر هكذا؟ وماذا يعني هذا بالنسبة لاستخدام الذكاء الاصطناعي في أنشطة الأعمال؟

بجانب ذلك، ترجع نقاط الضعف في نماذج اللغات الكبيرة إلى الجودة ذاتها التي تسمح لها بتفسير وتقليد خطاب الأشخاص العاديين، مثل نطاق البيانات التي تم تدريبها عليها.

ولتدريب نماذج اللغات الكبيرة، تقوم العديد من الفرق العاملة في بعض المؤسسات مثل “أوبين إي آي” OpenAI و”جوجل” Google، بحذف الملايين من الأمثلة النصية المتاحة والمفتوحة على الإنترنت. على أن يغطي هذا المزيج تقريبًا كافة أنواع المحتوى المتاح على شبكة الإنترنت العامة، وكذلك عبر كل موضوع يمكن تصوره تقريبًا. ومن هذا، يمكن أن تطور نماذج اللغات الكبيرة فكرة ما عن اللغة التي يستخدمها الشخص العادي.

لكن المشكلة تظهر بمجرد الانتقال إلى مجال متخصص. حتى قبل تقديم المصطلحات الخاصة بمنطقة معينة، نجد أن التخصصات المختلفة غالبًا ما تستخدم تعريفات دقيقة ومميزة للكلمات مقارنة بالاستخدام اليومي. ولا يشمل ذلك التعريفات فقط، إذ قد يكون لأحد التخصصات علاقات مختلفة جدًا بين المفاهيم والمصطلحات وذلك بالمقارنة بنفس المفاهيم الموجودة في تخصص آخر.

ونتيجة لذلك، غالبًا ما ينتهي الأمر عند نماذج اللغات الكبيرة التي يتم طرحها في مجال متخصص في التشبيه الخاطئ من منطقة غير ذات صلة، أو استخدام التعريفات الخاطئة عند الحصول على المعلومات، أو إساءة فهم السؤال المطروح عليها. غير أن المشكلة الكبيرة التي تواجه نماذج اللغات الكبيرة في عمليات البحث، تكمن في أن العديد منها ليست مصممة لأي طلبات للحصول على معرفة متخصصة.

إذًاما هي المساحة المتاحة للذكاء الاصطناعي في عالم البحث على الإنترنت؟

يكمن الجواب في نماذج اللغة الذكية، ذلك أنها نماذج مدربة على مجموعة بيانات منسقة وعالية الجودة، بالإضافة إلى المحتوى العلمي، والتي يتم استهدافها منذ البداية للتركيز على سياق عمل معين أو مجال خبرة. علاوة على ذلك، فإن ثمة تركيزًا قويًا على الدقة الواقعية لكل من النتائج التي يتم الحصول عليها، بالإضافة إلى الاستشهاد بالمصادر المستخدمة للوصول إلى هذه النتائج.

ثم إن هذه النماذج الذكية للغة تنطوي على تباين قوي مع المشكلات الحالية المتعلقة باستخدام نماذج اللغات الكبيرة في عمليات للبحث، إذ لا يوجد ضمان لصحة الحقائق ولا الاستشهاد بالمصادر. كما أن الإنترنت لا يعمل من خلال الروابط والتصنيفات والإعلانات، وهو ما يزيد من تعقيد التحليل الذي تعتمد عليه نماذج اللغات الكبيرة في عمليات البحث.

وعلى ذلك، يمكن لنماذج اللغات الكبيرة أن تدرك الكثير من الدروس من نماذج اللغة الذكية. فمن خلال منح الأولوية لقابلية الشرح والدقة، يمكن تحويل قدرة نماذج اللغات الكبيرة إلى تعطيل محركات البحث التقليدية.

إعداد: وحدة الترجمات بمركز سمت للدراسات

 

اترك رد

Your email address will not be published.