معركة محمومة.. الذكاء الاصطناعي التوليدي داخل جيبك

24

بدأ السباق لإدخال التكنولوجيا وراء برمجية شات جي بي تي إلى الهاتف الذكي في جيبك. وللحكم من السرعة المدهشة التي تتقدم بها التكنولوجيا، فإن التحركات الأخيرة في مجال الذكاء الاصطناعي يمكن أن تحول اتصالات الهاتف المحمول والحوسبة بشكل أسرع بكثير مما بدا محتملا قبل أشهر قليلة فقط، حسب ما ذكرت صحيفة الاقتصادية.

بينما تندفع شركات التكنولوجيا لتضمين الذكاء الاصطناعي التوليدي في برامجها وخدماتها، فإنها تواجه تكاليف حوسبة أعلى بشكل ملحوظ. أثر القلق بشكل خاص في شركة جوجل، مع تحذير محللي وول ستريت من أن هوامش ربح الشركة يمكن أن تتقلص إذا توقع مستخدمو شركة البحث على الإنترنت محتوى يولده الذكاء الاصطناعي في نتائج البحث القياسية.

إن تشغيل الذكاء الاصطناعي التوليدي على الهواتف المحمولة، بدلا من السحابة على الخوادم التي تديرها مجموعات التكنولوجيا الكبرى، يمكن أن يجيب عن أحد أكبر الأسئلة الاقتصادية التي أثارتها أحدث بدعة تكنولوجية.

قالت شركة جوجل الأسبوع الماضي إنها تمكنت من تشغيل نسخة من بالم 2، أحدث نموذج لغوي كبير لها، على هاتف سامسونج جالكسي. ورغم أنها لم تشرح علنا النموذج المصغر، المسمى جيكو، فإن هذه الخطوة أحدث علامة على أن شكلا من أشكال الذكاء الاصطناعي الذي كان يتطلب موارد حوسبة موجودة فقط في مركز البيانات بدأ بسرعة يجد طريقه إلى أماكن أكثر بكثير.

قد يجعل هذا التحول خدمات مثل تشغيل روبوتات المحادثة أرخص بكثير بالنسبة إلى الشركات لتشغيلها ويمهد الطريق لمزيد من التطبيقات التحويلية باستخدام الذكاء الاصطناعي التوليدي.

كريستيانو آمون، الرئيس التنفيذي لشركة كوالكوم لرقائق الهاتف المحمول، قال لـ”فاينانشيال تايمز”، “نحتاج إلى جعل الذكاء الاصطناعي هجينا – أي يعمل في مركز البيانات ومحليا – وإلا فإنه سيكلف كثيرا من المال”. وقال إن الاستفادة من قوة المعالجة غير المستخدمة على الهواتف المحمولة أفضل طريقة لتوزيع التكلفة.

عندما أثار إطلاق برمجية شات جي بي تي في أواخر العام الماضي اهتماما واسعا بالذكاء الاصطناعي التوليدي، بدت احتمالية إدخاله في الهواتف بعيدة. فإلى جانب تدريب ما يسمى بالنماذج اللغوية الكبيرة وراء مثل هذه الخدمات، فإن عمل الاستنتاج – أو تشغيل النماذج لتحقيق النتائج – يتطلب كثيرا أيضا من الناحية الحسابية. تفتقر الهواتف المحمولة إلى الذاكرة اللازمة لاستيعاب النماذج الكبيرة مثل تلك الموجودة خلف برمجية شات جي بي تي، فضلا عن قوة المعالجة المطلوبة لتشغيلها.

كما قد يؤدي توليد جواب لاستعلام على جهاز، بدلا من انتظار مركز بيانات بعيد لإنتاج نتيجة، إلى تقليل زمن الوصول، أو التأخير، الناجم عن استخدام أحد التطبيقات. وعند استخدام البيانات الشخصية للمستخدم لتحسين الاستجابات التوليدية، فإن الاحتفاظ بجميع عمليات المعالجة على الهاتف المحمول يمكن أن يعزز الخصوصية أيضا.

أكثر من أي شيء آخر، يمكن أن يسهل الذكاء الاصطناعي التوليدي تنفيذ الأنشطة المشتركة على الهاتف الذكي، مثلا عندما يتعلق الأمر بالأشياء التي تتضمن إنتاج نص. قال آمون، “يمكنك تضمين (الذكاء الاصطناعي) في كل تطبيق مكتبي: تتلقى بريدا إلكترونيا، فيقترح ردا. ستحتاج إلى القدرة على تشغيل هذه الأشياء محليا وكذلك في مركز البيانات”.

التطورات السريعة في بعض النماذج الأساسية غيرت المعادلة. تصدرت التطورات الأكبر والأكثر تقدما، مثل برمجية بالم 2 من شركة جوجل وبرمجية شات جي بي تي-4 من شركة أوبن أيه آي، عناوين الأخبار. لكن الانفجار في النماذج الأصغر أتاح بعض الإمكانات نفسها بطرق أقل تطلبا من الناحية التكنولوجية. استفادت هذه جزئيا من التكنولوجيات الجديدة لضبط نماذج اللغة بناء على معالجة أكثر دقة لمجموعات البيانات التي تم تدريبها عليها، ما يقلل من كمية المعلومات التي تحتاج إلى الاحتفاظ بها.

وفقا لآرفيند كريشنا، الرئيس التنفيذي لشركة أي بي إم، فإن معظم الشركات التي تتطلع إلى استخدام الذكاء الاصطناعي التوليدي في خدماتها الخاصة ستحصل على معظم ما تحتاج إليه عبر الجمع بين عدد من هذه النماذج الأصغر. وفي حديثه الأسبوع الماضي عندما أعلنت شركة أي بي إم عن منصة تكنولوجية لمساعدة عملائها على الاستفادة من الذكاء الاصطناعي التوليدي، قال إن كثيرين سيختارون استخدام نماذج مفتوحة المصدر، حيث تكون الرموز أكثر شفافية ويمكن تكييفها، جزئيا لأنه سيكون من الأسهل صقل التكنولوجيا باستخدام بياناتهم الخاصة.

أظهرت بعض النماذج الأصغر قدرات مذهلة بالفعل. وتشمل هذه للاما LLaMa، وهو نموذج لغة مفتوح المصدر أصدرته شركة ميتا، يدعى أنه يطابق كثيرا من ميزات الأنظمة الأكبر.

يأتي نموذج للاما بأحجام مختلفة، أصغرها يحتوي على سبعة مليارات نطاق فقط، أي أقل بكثير من 175 مليارا الموجودة في برمجية جي بي تي-3، نموذج اللغة الخارق لشركة أوبن أيه أي الذي تم إصداره في 2020، لم يتم الكشف عن عدد النطاقات في برمجية جي بي تي-4، التي تم إصدارها هذا العام. تم بالفعل عرض نموذج بحث يستند إلى برنامج للاما وتم تطويره في جامعة ستانفورد ويعمل على أحد أجهزة بيكسل 6 من شركة جوجل.

إضافة إلى حجمه الأصغر بكثير، فإن الطبيعة مفتوحة المصدر لنماذج كهذه سهلت أيضا على الباحثين والمطورين تكييفها مع بيئات الحوسبة المختلفة. عرضت شركة كوالكوم في وقت سابق من هذا العام ما ادعت أنه أول هاتف محمول بنظام أندرويد يعمل بنموذج توليد الصور ستيبل ديفيوجين، والذي يحتوي على نحو مليار نطاق. قال زياد أصغر، نائب الرئيس الأول في شركة كوالكوم، إن الشركة المصنعة للرقائق “حددت” أو خفضت حجم النموذج لتشغيله بسهولة أكبر على الهاتف المحمول دون أن يفقد أيا من دقته.

قال بن باجارين، المحلل في شركة كرييتف ستراتيجيز، بما أن معظم العمل على تصميم النماذج للهواتف المحمولة لا يزال في مرحلة تجريبية، فمن السابق لأوانه تقييم ما إذا كانت هذه الجهود ستؤدي إلى تطبيقات هواتف محمولة مفيدة حقا. وتنبأ بتطبيقات بدائية نسبيا، مثل وظائف تحرير الصور التي يتم التحكم فيها بالصوت وإعطاء إجابات بسيطة عن الأسئلة، من الموجة الأولى من نماذج الأجهزة المحمولة ذات نطاقات تراوح بين مليار وعشرة مليارات.

قال زوبين قهرماني، أحد نواب الرئيس في شركة جوجل، ديب مايند، ذراع أبحاث الذكاء الاصطناعي لشركة الإنترنت، إن نموذج جيكو للهواتف المحمولة يمكنه معالجة 16 رمزا في الثانية – مقياس يعتمد على عدد وحدات النص القصير التي تعمل بها النماذج اللغوية الكبيرة. تستخدم معظم النماذج الكبرى رمزا إلى رمزين مميزين لكل كلمة يتم إنشاؤها، ما يشير إلى أن نموذج جيكو قد ينتج نحو عشر إلى 15 كلمة في الثانية على الهاتف المحمول، ما يجعله مناسبا لاقتراح رسائل نصية أو ردود بريد إلكتروني قصيرة.

قال أصغر من شركة كوالكوم، إن المتطلبات الخاصة للهواتف المحمولة تعني أن الاهتمام من المرجح أن يتحول بسرعة إلى ما يسمى بالنماذج متعددة الوسائط التي يمكن أن تعمل مع مجموعة من الصور، والنصوص وغيرها من المدخلات. وأضاف أنه من المرجح أن تتوجه تطبيقات الهاتف بشكل كبير إلى الكلام والصور بدلا من التطبيقات التي تعتمد على النصوص بشكل أكبر والأكثر شيوعا على أجهزة الحاسوب الشخصية.

ومن المقرر أن تؤدي السرعة المدهشة التي بدأ بها الذكاء الاصطناعي التوليدي في الانتقال إلى الهواتف الذكية لزيادة الاهتمام بشركة أبل، التي ابتعدت حتى الآن عن حمى التكهن حول التكنولوجيا.

إن العيوب المعروفة في الذكاء الاصطناعي التوليدي، مثل ميل النماذج الكبيرة إلى “الهلوسة” – أو عندما يستجيب روبوت المحادثة بمعلومات ملفقة – جعلت من غير المحتمل أن تقوم شركة أبل بتضمين التكنولوجيا في نظام تشغيل أجهزة أيفون لبعض الوقت، وفقا لما ذكره باجرين من شركة كرييتف ستراتيجيز. وبدلا من ذلك، توقع أن تبحث الشركة عن طرق تسهل على مطوري التطبيقات البدء بتجربة التكنولوجيا في خدماتها الخاصة.

قال باجرين، “سترى هذا الموقف من قبل شركتي مايكروسوفت وجوجل أيضا: سترغب كلاهما في منح المطورين الأدوات اللازمة للتنافس (بتطبيقات الذكاء الاصطناعي التوليدية)”.

مع مؤتمر المطورين العالميين التابع لشركة أبل المقرر عقده في الخامس من حزيران (يونيو)، والذي يسبقه الحدث الخاص بشركة مايكروسوفت للمطورين والذي يسمى بيلد، فإن المعركة من أجل جذب اهتمام المطورين على وشك أن تشتد. ربما لا يزال الذكاء الاصطناعي التوليدي في مراحله الأولى، لكن الاندفاع للوصول إلى مزيد من المستخدمين – والأموال – يتحرك بالفعل بسرعة هائلة.

اترك رد

Your email address will not be published.