قد يدور السباق التالي للذكاء الاصطناعي حول الفيديو التوليدي
Mark Sullivan
سوق الفيديو بالذكاء الاصطناعي متعطش للاختراقات والمواهب
يوجد حاليًا 20 إلى 30 شركة فقط تعمل على تطوير نماذج توليد الفيديو. وقبل 18 شهرًا، كانت هذه الشركات تواجه صعوبة في الحصول على التمويل؛ لأنه في وقت كانت فيه روبوتات الدردشة لا تزال في مراحلها البدائية، وكانت فكرة إنتاج فيديو يشبه الحياة تبدو بعيدة المنال. لكن أدوات توليد الفيديو مثل Runway وSora من OpenAI قد غيرت الموازين تمامًا، وقد لاحظ وادي السيليكون ذلك.
يقول روبرت نيشيهارا، المؤسس المشارك والرئيس التنفيذي لشركة Anyscale، التي تساعد منصتها المطورين على تدريب وتشغيل وتوسيع نماذج وتطبيقات الذكاء الاصطناعي بكفاءة: “أرى نقطة تحول تحدث الآن. إنه في الغالب سباق لبناء أفضل نموذج”.
في هذا السباق الجديد للذكاء الاصطناعي التوليدي، لدينا عمالقة الذكاء الاصطناعي، مثل OpenAI إلى جانب شركات مثل: veed.io، وPika Labs، وLoom، وCaptions، وDescript. والشركات في مجال الفيديو، مثل مطوري نماذج اللغة الكبيرة قبلها، تشهد تحسينات في نتائجها مع تزويد نماذجها بمزيد من بيانات التدريب والمزيد من قوة الحوسبة.
لكن لا يزال هناك الكثير من العمل للقيام به. يقول نيشيهارا: “في الوقت الحالي، نحن في مرحلة وجود بعض العروض التوضيحية المثيرة للإعجاب حقًا. Sora مدهشة، لكن المجال لا يزال ناشئًا، ولم تصل أي من النماذج إلى مستوى الفائدة الواسعة”.
في الواقع، حالات الاستخدام الحالية ضيقة نسبيًا. على سبيل المثال، يتيح لك Hey Gen تحميل فيديو لنفسك وأنت تتحدث، ثم يولد فيديو لك وأنت تقول نفس الشيء بعدة لغات مختلفة، مع حركات فم مناسبة وواقعية… إلخ.
بشكل عام، لم تتقدم نماذج توليد الفيديو إلى النقطة التي يمكنها فيها إعادة إنشاء مشهد من خيال المستخدم كفيديو حقيقي. يقول نيشيهارا: “ستولد هذه النماذج شيئًا مختلفًا في الوقت الحالي. ربما يكون الشيء رائعًا، لكنه ليس ما كنت أفكر فيه بالضبط”. وتفتقر الأدوات الحالية إلى قدرات التحرير اللازمة لتعديل الفيديو. ويضيف: “إنها تفتقر إلى القابلية للتحكم. لا يزال هناك الكثير من العمل الذي يجب القيام به في هذا المجال”.
تطوير نماذج توليد الفيديو هو عمل مكلف. مع زيادة حجم النماذج، تزداد أيضًا تكاليف تدريبها، بما في ذلك حجم أكبر تدريجيًا من قوة الحوسبة السحابية. يجب على الشركات الناشئة في هذا المجال أيضًا جذب المواهب اللازمة لتطوير نماذج الفيديو وبناء البنية التحتية. يقول نيشيهارا: “هناك قيمة كبيرة للأشخاص الذين قاموا بذلك من قبل. ليس هناك الكثير من هؤلاء الأشخاص”. والحصول على بيانات التدريب الصحيحة والتجريب بها، والتي تعني عادة كميات كبيرة من الفيديو المصنّف، هو أيضًا عملية مكلفة.
يقول نيشيهارا إنه مع اشتداد المنافسة لبناء أفضل النماذج وارتفاع التكاليف المصاحبة، من المحتمل أن يحدث اندماجًا في هذا المجال. قد تتخلف بعض الشركات في البحث وتبيع أسهمها. وكما رأينا، فإن الشركات الكبرى مثل Microsoft وGoogle تراقب عن كثب دائمًا، ومستعدة لدفع مبالغ كبيرة للحصول على المواهب المتميزة أو الأبحاث الواعدة.
شركات تصنيع الرقائق تزيد من جهودها لكسر احتكار Nvidia للذكاء الاصطناعي
أعلنت Google مؤخرًا عن شريحة جديدة تعتمد على ARM في مؤتمرها السحابي في لاس فيغاس. وفي وقت لاحق، أعلنت Intel عن نسخة جديدة من رقائق تسريع Gaudi للذكاء الاصطناعي. كلا العملاقين التقنيين يحاولان مواجهة Nvidia، التي تسيطر على حوالي 80% من سوق رقائق الذكاء الاصطناعي.
شريحة Google المعتمدة على ARM، المسماة Axion، هي وحدة معالجة مركزية من المتوقع أن تقوم بتشغيل وظائف الحوسبة السحابية العامة، على الأقل في المدى القصير. والأكثر أهمية بالنسبة للذكاء الاصطناعي هو إعلان الشركة عن نسخة جديدة وأسرع من وحدة معالجة التنسور السحابية “TPU”، وهي Cloud TPU v5p، والتي تقول الشركة إنها أقوى وأشمل مسرع للذكاء الاصطناعي حتى الآن. وحدات TPU مناسبة بشكل جيد لتدريب النماذج الكبيرة للذكاء الاصطناعي، خاصة نماذج توليد الصور والفيديو. وتقول إحدى شركات توليد الفيديو Lightricks، إنها شهدت تضاعف السرعة في تدريب نماذج تحويل النص إلى صورة والنص إلى فيديو، مقارنةً بمسرع TPU v4 السابق من Google. لاحظ أن Google Cloud لا تزال مشترية رئيسية لوحدات معالجة الرسوميات من Nvidia.
Intel، من جانبها، تقول إن شريحتها الجديدة لتسريع الذكاء الاصطناعي، Gaudi 3، يمكنها أداء وظائف الاستدلال “أي تحليل البيانات اليومي بواسطة النماذج المدربة” بشكل أفضل بنسبة 50% من وحدات معالجة الرسومات Nvidia H100، بينما تكون أكثر كفاءة في استهلاك الطاقة بنسبة 40%، وكل ذلك بـ”جزء من التكلفة”. لكن التأثير الحقيقي لشريحة Gaudi 3 في السوق قد يكون أقل وضوحًا. وتوقع المحلل باتريك مورهد في قناة CNBC أن Gaudi 3 “ستأخذ نسبة معينة، ربما حصة سوقية من رقم واحد في هذا، لكنني لا أعتقد أن هذا سيكون تغييرًا جذريًا منذ البداية”.
التشكيك لدى مورهد يستند إلى حقيقة أن Nvidia كانت تعمل بجد لجعل مطوري الذكاء الاصطناعي يستخدمون طبقات البرامج الملكية التي بنتها على رقاقاتها. واحدة من هذه الطبقات هي CUDA من Nvidia، التي تتيح للمطورين الوصول إلى جميع أداء وميزات رقاقات إنفيديا. عملاء الشركات ومراكز البيانات أقل احتمالًا للانتقال إلى رقاقات مختلفة قد تكون غير متوافقة مع البرامج. والميزة لإنفيديا. لكن إنتل تقول إنها كانت تعمل مع شركاء الصناعة، مثل: جوجل وكوالكوم وآرم، لبناء برامج مفتوحة تسهل على مطوري الذكاء الاصطناعي استخدام رقاقات أخرى، غير رقاقات Nvidia.
الشركات لا تزال تشير إلى مشكلات دقة نماذج اللغة الكبيرة
كيف يشعر المستهلكون والشركات بشأن ظهور الذكاء الاصطناعي؟ من خلال عدد الاستطلاعات التي تصدر كل أسبوع، يبدو أن الكثير من الناس يريدون معرفة ذلك. فيما يلي بعض النقاط المختارة من نتائج الاستطلاعات الأخيرة:
وجد استطلاع للرؤساء التنفيذيين والمتخصصين في الذكاء الاصطناعي أجرته Writer AI أن حلول الذكاء الاصطناعي التوليدي غالبًا ما تكون غير كافية، حيث تعاني 61% من الشركات من مشكلات في الدقة، وفقط 17% منها تقيم حلولها الداخلية على أنها ممتازة من حيث الأداء العام. كما وجد الاستطلاع أن 78% من الشركات التي شملها الاستطلاع إما تستخدم بالفعل أو تخطط لاستخدام حلول الذكاء الاصطناعي التوليدي الخاصة بها بسبب مخاوف تتعلق بـ”الأمان وحماية البيانات والحاجة إلى ضوابط قوية”.
استطلاع من Ipsos سأل الأميركيين عن كيفية استخدامهم لنماذج الذكاء الاصطناعي. وتبين أن العدد الأكبر، 43%، يستخدمها “للبحث عن المعلومات”، مما قد يبشر بالخير للشركات مثل: Microsoft وGoogle وPerplexity التي تحاول استخدام الذكاء الاصطناعي لمساعدة الناس في البحث على الإنترنت. الاستخدام التالي الأكثر شعبية كان “لمقارنة الأشياء” بنحو 26%، ويليه “للترفيه” 25%.
استطلعت شركة توفير الموظفين Adecco Group آراء 2000 من المديرين التنفيذيين في الشركات الكبيرة حول العالم، ووجدت أن 41% منهم يعتقدون أن الذكاء الاصطناعي سيؤدي إلى تقليص القوى العاملة في السنوات الخمس المقبلة.
واستطلعت شركة إدارة البيانات AvePoint آراء “قادة أماكن العمل الرقمية” في قطاعات الرعاية الصحية والخدمات المالية وتكنولوجيا المعلومات والحكومة، ووجدت أن 44% فقط من المنظمات لديها ثقة بأنها تستطيع استخدام الذكاء الاصطناعي بأمان، وأن ما يقرب من نصفها قد واجه انتهاكًا غير مقصود للبيانات عند تنفيذ الذكاء الاصطناعي.
المصدر: Fast Company