أداة “إيمو” لتعديل الصور بواسطة الذكاء الاصطناعي

42

AI بالعربي – متابعات

أصبحت أدوات الذكاء الاصطناعي هي الظاهرة الأكثر انتشاراً في مجال التكنولوجيا في يومنا هذا، حيث تسعى كافة الشركات والمنصات الكبيرة إلى تقديم حلول ذكية متطورة لمختلف التحديات والمشكلات التي يواجهها المستخدمون من خلال هذه التكنلوجيا، وشركة “ميتا” ليست استثناء من هذا السياق، ففي سبتمبر الماضي كشفت الشركة عن نموذجها الخاص الذكي الذي يحمل اسم “إيمو” والذي تم تسميته تيمناً باسم أحد أنواع الطيور، واليوم تعلن الشركة عن توفر هذا النموذج مع إضافة مجموعة من القدرات الجديدة، بما في ذلك إمكانية تعديل الصور بالذكاء الاصطناعي، وإليكم التفاصيل.

تعديل الصور بالذكاء الاصطناعي سوف يصبح متاحاً عبر “ميتا” من خلال أداة “إيمو”

لمحة عن الميزات الجديدة لأداة “إيمو” المختصة في تعديل الصور بالذكاء الاصطناعي

تمت إضافة ميزات جديدة من قبل “ميتا” إلى نموذج “إيمو” الخاص بها، وتشمل هذه الميزات إمكانية تعديل الصور بالذكاء الاصطناعي بسهولة وإنشاء صور ومقاطع فيديو مباشرة من النصوص عبر المنصة، ورغم أن الشركة قامت بتقديم نظرة عامة على هذه الميزات الجديدة على صفحتها الرسمية، إلا أن الوصول إلى هذه الأدوات الجديدة لا يزال مقيداً في الوقت الحالي, وفقا لتقرير نشرته بوابة الصبح.

من الجدير بالذكر أن إطلاق أدوات مبتكرة من هذا النوع يمنح منصات التواصل الاجتماعي مثل “إنستغرام” و”فيسبوك” ميزة تنافسية كبيرة، حيث يتسنى للمستخدمين إنشاء وتعديل الصور بالذكاء الاصطناعي إضافة إلى إنشاء وتعديل مقاطع الفيديو بذات التقنية أيضاً ومشاركتها مباشرة عبر المنصة دون الحاجة إلى استخدام موقع وسيط أو أداة ذكية إضافية.

صورة لطائر "الإيمو" وهو يرتدي النظارات الشمسية مع خلفية يظهر بها "شاطئ" و"بحر"، تم إنشاء هذه الصورة بوساطة أداة "إيمو" المختصة في تعديل الصور بالذكاء الاصطناعي والتي يتم إدارتها بواسطة شركة "ميتا".
صورة لطائر “الإيمو” وهو يرتدي النظارات الشمسية مع خلفية يظهر بها “شاطئ” و”بحر”، تم إنشاء هذه الصورة بوساطة أداة “إيمو” المختصة في تعديل الصور بالذكاء الاصطناعي والتي يتم إدارتها بواسطة شركة “ميتا”.

 

تشير “ميتا” إلى أنها لم تحدد بعد تاريخ إطلاق هذه الأداة بشكل رسمي، وتستمر في وصفها بأنها في مرحلة اختبار على الرغم من النتائج المبهرة التي تحققها الأداة.

بعض الحقائق حول نموذج “إيمو”

فيما يلي بعض الجوانب التقنية لأداة “إيمو” لتعديل الصور بواسطة الذكاء الاصطناعي:

  • يتم تدريب النموذج باستخدام 1.1 مليار زوج من الصور والنصوص، ويتم ضبطه بعناية باستخدام عدد قليل من الصور عالية الجودة المختارة بعناية.
  • يتم تصميم النموذج لإنشاء صور مفصلة بحجم 1024 × 1024 بيكسل، باستخدام تقنية تسمى “بنية الانتشار الكامن”، وهذه التقنية تتضمن ميزة تسمى “المشفر التلقائي”، وهذه الأخيرة تساعد “إيمو” في فهم وتذكر الأجزاء الهامة في الصورة مما يسمح له بإعادة إنشاءها بدقة.
  • يقوم نموذج “إيمو” بتحويل قنوات الألوان الأساسية (الأحمر والأخضر والأزرق) أو ما يرمز له اختصاراً بـ “RGB” إلى عدة قنوات، حيث زيادة حجم كل قناة إلى 16 قناة مما أدى إلى تحسين جودة الصور المصنوعة بواسطة الأداة بشكل كبير، تمت أيضاً تجربة تحويل كل قناة إلى 32 قناة أخرى ولكن التحسينات مقارنةً بالـ 16 قناة لم تكن كبيرة، لذا تم الاكتفاء ب 16 قناة.
  • وقت إنشاء الصورة في “إيمو” هو خمس ثوان فقط.

 

صورة تشرح عمل أداة "إيمو" المختصة في تعديل الصور بالذكاء الاصطناعي حيث يظهر على اليسار الصور التي تم تدريب النموذج عليها، وعلى اليمين تظهر الصورة التي أنتجتها الأداة بمساعدة من البشر لضمان جودة الصورة الناتجة، وتحت كل صورتين من اليمين واليسار يظهر نص يفسر مضمون الصورتين.

صورة تشرح عمل أداة “إيمو” المختصة في تعديل الصور بالذكاء الاصطناعي حيث يظهر على اليسار الصور التي تم تدريب النموذج عليها، وعلى اليمين تظهر الصورة التي أنتجتها الأداة بمساعدة من البشر لضمان جودة الصورة الناتجة، وتحت كل صورتين من اليمين واليسار يظهر نص يفسر مضمون الصورتين.

هل سيكون مصير هذه الخاصية مثل أداة “Voice box” لتقليد الأصوات؟

قبل الإعلان عن “إيمو” بفترة وجيزة، كان “Voice box” أحدث ابتكارات “ميتا” في مجال الذكاء الاصطناعي، وهي أداة تحويل النصوص إلى صوت، وبحسب تصريحات الشركة، يعتبر “Voice box”، خطوة ثورية في عالم توليد الأصوات باستخدام الذكاء الاصطناعي.

صورة توضح مجموعة الأصوات المختلفة التي يمكن لأداة “Voice box" تقليدها.
صورة توضح مجموعة الأصوات المختلفة التي يمكن لأداة “Voice box” تقليدها، والتي منها شخصيات فنية وسياسية بارزة، مثل الرئيس الأمريكي الحالي “جو بايدن” والرئيس الأمريكي الأسبق “دونالد ترامب” إضافة إلى “باراك أوباما” و”جورج بوش” والمرشحة “هيلاري كلينتون”.

 

إحدى الاستخدامات المفيدة لمثل هذه الأداة تتجلى في تمكين الأفراد ذوي التحديات البصرية من الاستفادة من أدوات الذكاء الاصطناعي مثل “ChatGPT” حيث يمكن للمستخدمين عبر هذه الأداة التحدث مباشرةً إلى النموذج وانتظار رده بتشكيل صوت بشري.

ومع ذلك، قبل أن تطلق “ميتا” أدوات كهذه، تحتاج الشركة إلى إيجاد طريقة لتقييد استخداماتها وتجنب عمليات التزوير وانتحال الشخصيات السلبية، ولهذا السبب أعلنت الشركة أنها تشعر بالتردد في إطلاقها حالياً، فهل ستتردد “ميتا” في طرح “إيمو” أيضاً لخوفها من بعض السلبيات؟.

اترك رد

Your email address will not be published.