تقدم مذهل في إنتاج الفيديوهات بالذكاء الاصطناعي.. وتساؤلات مشروعة

AI بالعربي – متابعات

كشفت شركة OpenAI للذكاء الاصطناعي على نموذج جديد أطلق عليه اسم “Sora” يمكنه إنتاج الفيديوهات من خلال النصوص المكتوبة. النتائج المذهلة للنموذج الجديد فتحت الباب أمام تساؤلات حول خصوصية البيانات ومستقبل صناعة الترفيه، وفقا لتقرير نشره موقع DW.

تطور مذهل يشهده الذكاء الاصطناعي المستخدم في إنتاج مقاطع الفيديو بعد الكشف عن Sora، مولّد تحويل النص إلى فيديو باستخدام الذكاء الاصطناعي من شركة OpenAI. تستخدم الأداة، التي كشفت عنها الشركة قبل أيام، الذكاء الاصطناعي التوليدي لإنشاء مقاطع فيديو قصيرة على الفور بناءً علىأوامر مكتوبة. وكانت النتائج الأولية مذهلة حتى أن البعض خُدع في الفيديوهات المنتجة، معتقداً أنها مشاهد حقيقية من أرض الواقع كما في الفيديو التالي:

والواقع أن “Sora” ليس إنتاجات هذا النوع من التكنولوجيا المتقدمة، لكن الخبراء يشيرون إلى الجودة العالية لمقاطع الفيديو التي تعرضها الأداة حتى الآن، مؤكدين أن كشف الستار عنها يمثل قفزة كبيرة سواء للشركة أو لمستقبل إنشاء تحويل النص إلى فيديو عموماً. ومع ذلك، وكما هو الحال مع كل الأشياء في مجال الذكاء الاصطناعي سريع النمو في هذه الأيام، تثير هذه التكنولوجيا أيضًا مخاوف بشأن الآثار الأخلاقية والمجتمعية المحتملة.

كيف يعمل “Sora”؟

تقوم الأداة الجديدة “Sora بإنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية”حتى الآن!” بناءً على طلبات مكتوبة باستخدام الذكاء الاصطناعي التوليدي، كما يمكن للنموذج أيضًا إنشاء فيديو من صورة ثابتة موجودة. والذكاء الاصطناعي التوليدي هو فرع من الذكاء الاصطناعي يمكنه إنشاء شيء جديد تماماً. تشمل الأمثلة روبوتات الدردشة، مثل ChatGPT من OpenAI، ومولدات الصور مثل DALL-E وميد جيرني Midjourney.

قامت شركة OpenAI بتغذية “Sora” بمقاطع فيديو وصور وتم تدريبه على تحويل الصور الثابتة والنصوص بما يعرف باسم “محولات الانتشار”، لتحويل ما تمت تغذيته به إلى فيديوهات ومشاهد متحركة. كما تم تدريب “Sora” على إنتاج الفيديوهات بجودات ودرجات وضوح وأطوال مختلفة، آخذاً في الاعتبار النسب المنطقية للأبعاد وتدرجات الألوان وغيرها من العوامل، وفق ما ذكر موقع “ماشابل” التقني المتخصص.

متى يمكن أن يتاح “Sora” للعامة؟

حتى الآن فإن “Sora” ليس متاحًا للاستخدام العام. تقول OpenAI إنها تتواصل مع صانعي السياسات والفنانين قبل إطلاق الأداة رسميًا، لكن في الحقيقة فإن الكثير من الجوانب المحيطة بالأداة نفسها يحيطها الكثير من الغموض. وبحسب موقع “تك. كو” التقني المتخصص فإن نموذج الذكاء الاصطناعي الجديد يتم إخضاعه في الوقت الحالي للفحص الدقيق من قبل باحثين أمنيين مسؤولين عن ضمان سلامته وأمانه، إضافة إلى تقييم “المخاطر الحرجة” الناشئة عن استخدامه وذلك قبل إصداره للجمهور.

ومنحت الشركة مجموعة محدود للغاية من الفنانين وصانعي الأفلام والمصممين إمكانية الوصول إلى “Soraا” بهدف تجربته بكامل إمكانياته والتعرف على المزايا والعيوب. لكن يبدو أن بعض الحسابات المعروفة في منتدى OpenAI تشير إلى أنه ستكون هناك قائمة انتظار طويلة سيتم طرحها في مرحلة ما لضم المزيد من الأشخاص، دون تحديد موعد واضح لإمكانية عمل ذلك. ومنذ إعلان إطلاق “Sora”، نشرت الشركة عددًا من الأمثلة لمقاطع الفيديو التي أنشأها النظام لإظهار إمكانياته، وهو ما فعله سام التمان الرئيس التنفيذي للشركة على حسابه بموقع “اكس” والذي طلب من المتابعين ارسال أفكار لفيديوهات يرغبون في إنتاجها وقام بنشر الفيديوهات لاحقاً:

أدوات أخرى لصناعة الفيديو بالذكاء الاصطناعي

لم تكن “Sora” هي الأداة الأولى من نوعها التي تقوم بإنتاج الفيديوهات من خلال أوامر أو نصوص مكتوبة، فشركات مثل غوغل، وميتا، والشركة الناشئة Runway ML تُعد من بين الشركات التي لديها تكنولوجيا مماثلة. لكن بحسب الخبراء فإن النتائج التي جاءت من “Soraا” لا يمكن مقارنة جودتها مع الأدوات الأخرى، سواء من حيث جودة الصور والوضوح والطول ما يجعل “Sora” نقلة مذهلة في هذا المجال. قال فريد هافيماير، رئيس قسم الذكاء الاصطناعي وأبحاث البرمجيات في شركة ماكواري بالولايات المتحدة، إن إطلاق “Soraا” يمثل خطوة كبيرة إلى الأمام بالنسبة لهذه الصناعة، بحسب ما نقل موقع “يورونيوز”.

وأضاف: “لا يمكنك فقط إنشاء مقاطع فيديو أطول، فأنا أفهم أن تنتج مقطعاً يصل إلى 60 ثانية ببعض الأدوات، لكن اليوم يمكن إنتاج فيديوهات طويلة كما أن مقاطع الفيديو التي يتم إنشاؤها من خلال “Sora” تبدو طبيعية أكثر ويبدو أنها تحترم قوانين الفيزياء وتقترب من العالم الحقيقي بشكل أكبر”. وبالعودة إلى “Sora”، فقد يرى البعض أن المنتج النهائي لا تشوبه شائبة في الوقت الحالي، لكن الشركة تؤكد أنه لا تزال هناك بعض نقاط الضعف بما في ذلك بعض العناصر المتعلقة بالمكان وبعض النتائج التي لم تكن على المستوى المطلوب كما يظهر في هذا الفيديو:

أزمات قانونية وأخلاقية حالية ومستقبلية

وبحسب الخبراء فإن المشكلة القانونية والأخلاقية تعلقت في بداية الأمر بكيفية الحصول على بيانات التدريب لنماذج الذكاء الاصطناعي منذ أن أطلقت الشركة نموذج ChatGPT. فقد تم اتهام كل من OpenAI وجوجل بـ”سرقة” البيانات بهدف تدريب نماذجهم الجديدة للذكاء الاصطناعي، أو بعبارة أخرى استخدام البيانات المأخوذة من وسائل التواصل الاجتماعي، ومنتديات الإنترنت وقواعد بيانات الكتب الخاصة، والمواقع الإخبارية دون الحصول على إذن مسبق.

وكان الرد هو أن الأساس المنطقي لاستخراج بيانات التدريب من الإنترنت بالكامل هو أن هذه البيانات متاحة للجمهور. لكنّ ما هو متاح للجمهور لا يجب نشره دائمًا في المجال العام. على سبيل المثال، رفعت صحيفة نيويورك تايمز دعوى قضائية ضد شركتي OpenAI و مايكروسوفت بسبب انتهاك حقوق الطبع والنشر، زاعمة أن نماذج OpenAI استخدمت أعمال التايمز حرفياً أو استشهدت بالقصص بشكل غير صحيح. واذا كان هذا هو الحال مع النصوص المكتوبة، فيمكننا أن تتوقع كيف سيكون الأمر مع كبار العاملين في صناعة الترفيه وخصوصاً في الولايات المتحدة.

انتهاك للخصوصية وحقوق النشر؟

أيضاً، تظل المشكلة قائمة، إذ لازلنا لا نعرف مصدر بيانات تدريب “Sora”. كتب غاري ماركوس، خبير الذكاء الاصطناعي الذي أدلى بشهادته في جلسة استماع لجنة مراقبة الذكاء الاصطناعي بمجلس الشيوخ الأمريكي: “لقد التزمت الشركات الصمت بشأن الكيفية التي قاموا من خلالها بتدريب نماذج الذكاء الاصطناعي بل وما تم تدريب تلك النماذج عليه”. وأضاف: “يعتقد الكثيرون أنه من المحتمل أن يكون هناك منتجات استخدم فيها الذكاء الاصطناعي باستخدام محركات الألعاب مثل Unreal على سبيل المثال دون أن نعلم.. لذا لن أتفاجأ على الإطلاق إذا كان هناك أيضًا الكثير من التدريب لهذه النماذج من خلال المحتوى المنشور في موقع يوتيوب أو العديد من المواد المحمية بحقوق الطبع والنشر”.

على الجانب الآخر، بدأ صناع محتوى الفيديو يشعرون بالقلق على مستقبلهم من وجود أداة تقوم بعمل ما يقومون به وفي المستبقل ربما تتجاوز جودة المواد المنتجة أبعد مما يمكن للبشر إنتاجه مهما حاولوا، وهو ما يهدد مصدر دخل ومسقبل الكثيرين حول العالم في هذه الصناعة. لكن المتفائلين يرون أن هذا النوع من التطور قد يؤدي إلى زيادة الطلب على أدوات إنتاج الفيديو الإبداعية مثل Premiere ومع الوقت يمكن دمج مثل هذه التقنيات فيها، ما يحسن من جودة العمل بشكل مذهل مع وجود اللمسة الإنسانية في المنتج النهائي. ويرى آخرون أن هذه التقنيات ستتاح بشكل مبالغ فيه مادياً في البداية، ما يجعل إنشاء مقاطع الفيديو الطويلة أمرًا مكلفًا للغاية من الناحية المالية.

لكن الخبراء يتفقون في النهاية على أن البشرية في حاجة دائمة إلى التعديل والتطوير والابتكار، وأن الذكاء الاصطناعي سيعزز الإبداع البشري وسيظل للإنسان دائماً الأهمية الكبرى في هذا العالم المستقبلي.