ثورة «GPT-4o» فرص ومخاطر التطبيقات الجديدة للذكاء الاصطناعي
د. فاطمة الزهراء عبدالفتاح
فى يومين متعاقبين خلال شهر مايو 2024، أعلنت شركتا «أوبن أيه آى» (OpenAI) و«جوجل» (Google) العالميتين، عن تطويرهما جيلًا جديدًا من المساعدين الفائقين، قادرًا على التفاعل بالنص والصوت والصورة، وتحليل السياق المحيط، والاستجابة الفورية بشكل إنسانى وبصورة أقرب للتفاعل البشرى الحقيقى. إذ كشفت «أوبن أيه آى»، يوم 13 مايو الجارى، عن تطبيق «جى بى تى 40» (GPT-40) الذى يحمل حرف (O) اختصارًا للفظ (Omni) باعتباره تطبيقًا شاملًا وقادرًا على التفكير عبر الصوت والرؤية والنص فى الوقت الفعلى. علاوة على مشروع «أسترا» (Astra) الذى أعلنت عنه «جوجل»، يوم 14 مايو، فى مؤتمرها السنوى للمطورين، ووصفته بأنه وكيل ذكى لأداء كل المهام (AI-for-everything agent).
وتكشف هذه التطورات عن التنافس المُحتدم من أجل تقديم مساعد فائق شامل وقادر على أداء المهام كافة، بدءًا من اقتراح وجهة السفر، إلى كتابة النصوص المطولة، وإلقاء الأشعار، والتأليف الموسيقي؛ ما يطرح تحولات ثورية لتداخل الآلة فى تفاصيل الحياة اليومية بشكل يضاعف انتشار وتأثير الذكاء الاصطناعى، ويطرح فرصًا وتحديات تبدو أقرب من أى وقت مضى.
جيل جديد:
تُعد كلمة «جى بى تي» (GPT) اختصارًا للمحولات التوليدية المدربة مسبقًا، وهى التقنية التى قدمها الباحث الهندى أشيش فاسوانى وباحثون آخرون عام 2017 فى تجربة اُستخدمت فيها شبكة عصبية تعتمد على آلية الانتباه للقيام بأعمال الترجمة الآلية متعددة اللغات؛ إذ تسمح آلية الانتباه الذاتى للنموذج بتقييم أهمية الكلمات المختلفة فى الجملة عند ترميز كلمة معينة، وهو ما يساعده على فهم السياق بشكل أكثر فاعلية.
واستخدمت شركة «أوبن أيه آى» هذه التقنية المبتكرة لتقديم أولى نماذج محولات «جى بى تي» فى يونيو عام 2018 بسعة 117 مليون معلمة، ثم قدمت النسخة الثانية فى فبراير 2019 بسعة 1.5 مليار معلمة، وقدرة متقدمة على إنشاء نص متماسك وذى صلة بالسياق، وهو ما دفع الشركة إلى حجبه فى البداية بسبب مخاوف سوء الاستخدام، ثم تمت إتاحته بالكامل فى نوفمبر 2019، ما أعقبه بشهور قليلة إطلاق النسخة الثالثة فى يونيو 2020، والتى تتمتع بقدرات تعلم تنبؤية تمكنه من أداء مجموعة واسعة من المهام بأقل قدر من التعليمات ما جعله أساسًا لإنشاء تطبيقات متنوعة، بما فى ذلك مساعدى البرمجة، وأدوات إنشاء المحتوى، وروبوتات الدردشة. وهذا ما كان أساسًا لإطلاق تطبيق «شات جى بى تي» (ChatGPT) فى نوفمبر 2022 كنموذج للمحادثة المستندة للذكاء الاصطناعى يعتمد على بنية (GPT-3.5)، والذى حظى بنسخة جديدة فى مارس 2023 بإطلاق نموذج «جى بى تي-4» (GPT-4) والذى يمتلك قدرات أفضل على فهم وتوليد استجابات دقيقة ومناسبة للسياق، مع معالجة الاستعلامات الغامضة والتعليمات الأكثر تعقيدًا.
وفى 13 مايو 2024، أطلقت شركة «أوبن أيه آى» نموذج «جى بى تى 40»، بقدرات متقدمة فى استقبال وتوليد النص والصوت والصورة فى الوقت الفعلى، بما يمكنه من إنشاء التصميمات الفنية والعلامات التجارية، وإنتاج رسوم الكاريكاتير، وكتابة الشعر والروايات النصية والمرئية، والقيام بتسجيل الملاحظات والقيام بأعمال التلخيص والكتابة والترجمة، مع قدرة فائقة على التواصل مع البشر وفهم المشاعر والاستجابة لمدخلات الصوت فى أقل من 232 ملى ثانية، بمتوسط 320 ملى ثانية، المعدل الذى يقارب وقت الاستجابة البشرية فى المحادثة الطبيعية.
وبعدها بيوم واحد، أعلنت «جوجل»، فى مؤتمر المطورين يوم 14 مايو، عن مشروع «أسترا» والذى آثرت تسميته بـ«وكيل» (agent) أداء المهام اليومية، وهو ما يُعد نقلة لتطوير تطبيقها الذكى (Gemini) وكذلك مساعد جوجل الافتراضى. وعرضت «جوجل» سلسلة من الفيديوهات لتوضيح قدرات النظام، والذى يبدو أنه يشابه «جى بى تى 40»، إلا إنه يعرض قدرات بصرية أكثر تقدمًا، مثل القدرة على تذكُر المكان الذى تركت فيه نظارتك. وعلى الرغم من أن «جوجل» ستطلق هذا التطبيق خلال شهور، ما يمنح «أوبن أيه آي» ميزة السبق بإطلاق تطبيقها أولًا، فإنها تتمتع بميزة إضافية من خلال منصاتها القائمة؛ إذ تعتزم دمج النظام الذكى بمنصاتها المختلفة، بما فى ذلك «نظارة جوجل»، ما سيعزز إمكانات تلك المنصات، كما سيمنح التطبيق انتشارًا عالميًا سريعًا، ويعزز تبنيه من قِبل المستخدمين.
ولا يُعد هذا الاتجاه قاصرًا على «جوجل» وحدها، ولكن تتجه الشركات التكنولوجية بشكل عام لدمج المساعد الذكى فى تطبيقاتها المختلفة، ما يضاعف فرص انتشار هذه المساعدات بظهورها الفورى على واجهات استخدام آلاف الحواسيب والأجهزة حول العالم؛ إذ تعمل شركة «ميتا» على دمج نموذج (Llama 3) فى تطبيقات «فيسبوك» و«إنستغرام» و«واتساب». كما تدمج شركة «مايكروسوفت» مساعدها الذكى (Copilot) فى تطبيقات «مايكروسوفت 360» وتطبيق «إنترنت إكسبلورر» وواجهة محرك البحث (bing) وبرامج التصفح التابعة لها. وإن كانت شركة «أوبن أيه آي» لا تمتلك الإرث ذاته، فقد عقدت مفاوضات مع شركة «آبل» من أجل دمج نموذج «جى بى تى» فى أنظمة (IOS) من أجل منح المساعد (Siri) بنية تفكير أكثر تطورًا وكفاءة.
ويزيد من فرص انتشار تلك المساعدات أيضًا، سعى الشركات التكنولوجية لخفض تكلفة التعلم الآلى، بما يسمح بإتاحته بتكلفة أقل لمطورى التطبيقات الآلية؛ ومن ثم انتشارًا أكبر بين المستخدمين. وأعلنت «جوجل» فى مؤتمر المطورين 2024 عن إطلاق نموذج (Gemini 1.5 Flash)، الذى يعتمد على تقنية «التقطير» التى تجعله أسرع وأقل تكلفة.
تحديات متنوعة:
يتسم الذكاء الاصطناعى بكونه مزدوج الاستخدام؛ بحيث يمكن توظيفه فى الأغراض النافعة والضارة على السواء، فكما تعرض الفيديوهات الترويجية للتطبيقات الجديدة قدراتها على أداء المهام بكفاءة وتحليل عناصر البيئة المحيطة ومساعدة المستخدم على اتخاذ القرار، فإنها أيضًا تحمل فى طياتها تحديات على الأصعدة الاجتماعية والتقنية والأمنية وغيرها، كالتالى:
1- التأثيرات الاجتماعية والنفسية: إذ إن اعتماد المساعدين الفائقين على التفاعل الشبيه بالبشر بافتعال المشاعر والمزاح والتعقيب على شكل المستخدم أو حالته المزاجية أو مواساته، فضلًا عن أداء مهامه الاعتيادية مثل: حجز العطلات أو إدارة الوقت الاجتماعى أو أداء مهام حياتية أخرى؛ يخلق علاقة من الود والثقة بين المستخدم والآلة التى ترد على تساؤلات الإنسان وتؤنسه وتلقى عليه النكات وتبدى رأيها فى كل ديكوره المنزلى وتساعده على إنجاز مهامه. وعلى عكس الرفيق البشرى، فهو لا يغضب ولا يعجز ولا يشيخ ولا يطلب الهدايا أو يفرض على مستخدمه أعباءً اجتماعية ونفسية، وهو ما ينقل مساعدات الذكاء الاصطناعى إلى مستوى شعبى وجماهيرى غير مسبوق يعزز إيمان الجماهير بإمكانات تلك الآلات، ويزيد اعتماديتهم عليها، كما يمنح تلك الآلات قدرات غير محدودة على جمع المزيد من البيانات التى تعزز دقتها وقدراتها.
2- الاستقلالية الآلية: تحتاج هذه المساعدات إلى قدر من الاستقلالية للقيام بمهامها دون إزعاج المستخدم البشرى، ما يطرح جدلًا كبيرًا بشأن العلاقة بين قرار الآلة ومصلحة ورغبة الإنسان. وتطرق فريق (Google deep mind)، المتخصص فى فحص التحديات الأخلاقية للذكاء الاصطناعى، إلى هذه الإشكالية فى تقرير «أخلاقيات مساعدي الذكاء الاصطناعى المتقدمين»، الذى أصدره فى إبريل الماضى، وأشار إلى إشكالية الاتساق مع البشر (Human alignment)؛ إذ تناول فيها العلاقة بين قرار الآلة وفهم التفضيلات والقيم البشرية، إذ قد تقوم الآلة بترجمة خاطئة للتعليمات أو أن تكون التعليمات غير واضحة، فضلًا عن احتمالات تمتعها بمستوى كبير من الاستقلالية ما يزيد مخاطر اتخاذها إجراءات لا تتماشى مع قيم المستخدم واهتماماته، فضلًا عن احتمالات تواصل تلك المساعدات مع بعضها بعضًا.
3- غرف الصدى التوليدية: على الرغم من شيوع مصطلح «رجع الصدى» لوصف «مجتمعات الويب الاستقطابية» التى تتداول الآراء ذاتها بما يعزز انغلاق المستخدم على توجهاته الحالية، فإن باحثين أمريكيين وجدوا أن روبوتات الدردشة تمارس مفعولًا مشابهًا، وذلك فى دراسة أجروها على 272 مشاركًا لفحص ما إذا كان البحث على تلك التطبيقات المدعومة بالذكاء الاصطناعى يعزز التعرض الانتقائى ويحد من التعرض لآراء متنوعة. كما وجدوا أن تلك الروبوتات تميل إلى تكرار آراء الأشخاص الذين يستخدمونها، ما يخلق غرف رجع صدى توليدية تعزز تحيز المستخدمين.
4- مخاطر الاختراق: سبق أن أعلنت شركتا «مايكروسوفت»، و«أوبن أيه آي» المالكة لخدمات «شات جى بى تي»، فى فبراير 2024، عن تحديد خمسة مصادر للتهديد الإلكترونى استغلت تلك النماذج فى أعمال التخريب وشن الهجمات، كان منها اثنان تابعان للصين والأخرى لإيران وروسيا وكوريا الشمالية؛ إذ استغلتها فى الاستعلام عن المعلومات مفتوحة المصدر والترجمة والعثور على أخطاء الترميز وتشغيل مهام الترميز الأساسى، هذا إلى جانب احتمالات نماذج اللغة الكبيرة للهجمات والتى تُعد أشهرها هجمات الحقن الفورى التى تتلاعب بها.
فرص متفاوتة:
يحمل الذكاء الاصطناعى أثرًا تخريبيًا فائقًا باستحداث أنظمة إحلالية تعيد تشكيل الصناعات والأسواق والمفاهيم والعلاقات، ولاسيما مع تكامله مع تقنيات أخرى مثل: إنترنت الأشياء والبيانات الضخمة، وهو ما يعنى أن السنوات الخمس المقبلة قد تشهد تغيرات إحلالية باستبدال كل ما هو سائد، فلن نتعلم أو نتسوق أو نتواصل كما كان من قبل؛ وهو ما يعنى تغييرات هيكلية فى الأسواق والصناعات والعلاقات الاجتماعية لا يبدو العالم مستعدًا لها بالقدر ذاته.
وفى ظل الفجوة الهائلة فيما يتعلق بإمكانات الذكاء الاصطناعى، فإننا بصدد عالم من اللامساواة تتسع فيه الفجوة بين من يملكون تلك الأدوات الفائقة ومن لا يملكونها، وكذلك بين من يصنعونها ومن يستهلكونها. فعلى الرغم من الفرص العديدة التى تقدمها المساعدات الذكية الفائقة لجمع المعلومات والترجمة وابتكار الحلول والإجابة عن الأسئلة والتأليف، وغيرها من المهام التى طالما كانت حكرًا على الإنسان؛ فإنها تكشف بوضوح عن عالم من اللامساواة وفجوات آخذة فى التسارع بشكل غير مسبوق، ليس فقط على مستوى المستخدمين اللذين يتمتعون بتلك المزايا على نحو متفاوت وفق قدراتهم المادية والتقنية والمعرفية للوصول والاستخدام، وإنما على مستوى الدول أيضًا، حتى أن بعض الكتابات أشارت إلى ما سمته «الاستعمار الخوارزمي» للتعبير عن العلاقة غير المتوازنة بين المستفيدين والمحرومين.
وإن كانت الأطروحات التنموية خلال العقود الثلاثة الأخيرة، ما فتئت تحذر من مخاطر الفجوة الرقمية، فإن الفجوة التى يرتبها احتكار الذكاء الاصطناعى هى أكبر وأعمق وأسرع نموًا، ليس فقط على مستوى الدول والمجتمعات، وإنما بين القوى الفاعلة على المستويات الوطنية والدولية؛ إذ أصبحت الشركات التكنولوجية المطورة لنماذج التعلم الآلى المتقدمة وتقنيات الشبكات العصبية ذات قوة لا تضاهيها الحكومات والمنظمات الدولية التى تلجأ للتعاون تارة والعقوبات تارة أخرى من أجل ترويضها وإجبارها على التعاون، وهو ما تستبعد منه الدول النامية بشكل تام.
المصدر: المصري اليوم