الثورة التالية في عالم الذكاء الاصطناعي برعاية “Meta”
AI بالعربي – متابعات
يبدو أن “Meta” تريد المنافسة وبقوة والبقاء على الحدود المستمرة مع الثورة التقنية في مجال الذكاء الاصطناعي وبناءً عليه أعلنت عن منتج جديد ومنافس، وهو “CM3leon”. وفقًا لما نشرته صحيفة الشرق الأوسط.
“CM3leon”: القفزة التالية في عالم الذكاء الاصطناعي
يعد “CM3leon” نموذجاً أساسياً متعدد الوسائط لتحويل النص إلى صورة والعكس، مما يعني أنه يمكن استخدامه لتوليد تعليقات توضيحية للصور تلقائياً. في حين أن هذه ليست فكرة جديدة في مجال الذكاء الاصطناعي، الجديد هو الأداء الذي يزعم “Meta” أن نموذجها الأساسي قادر على تحقيقه. ولعل الأكثر إثارة هي الطريقة التي يتم بها بناء “CM3leon”.
الابتكارات الفريدة لـ”CM3leon”
يعد أغلب الأدوات التي تتيح توليد الصور من النصوص، مثل Stable Diffusion وDALL-E وMidjourney، تعتمد على ما تُعرف بنماذج التوزيع. في حين أن هذه النماذج قد أظهرت نتائج قوية، إلا أن “Meta” أخذت مساراً مختلفاً مع “CM3leon”. بدلاً من استخدام نموذج توزيع، يعتمد “CM3leon” على ما يُعرف بنموذج التسلسل التلقائي القائم على الرموز، الذي يعد أكثر تكلفة في التدريب ولكنه يُنتج صوراً بجودة ودقة أفضل عن منافسيه.
كفاءة فائقة
مع ذلك، رغم تعقيد النموذج، يُظهر “CM3leon” كفاءة مدهشة. حسبما ذكرت “Meta”، يتم تدريب “CM3leon” باستخدام الحاسوب بخمسة أضعاف أقل من الأساليب القائمة على التحويل السابقة. هذا يعني أنه يمكن أن يوفر أداءً متفوقاً بأقل تكلفة.
حقوق الصور وأخلاقيات التدريب
بعيداً عن الأداء والكفاءة، هناك جانب آخر يجعل “CM3leon” مميزاً، وهي الطريقة التي يجري بها تدريبه. بدلاً من الاستفادة من الصور المتاحة علنياً على الإنترنت -الأمر الذي أثار بعض القضايا القانونية المرتبطة بملكية الصور- تستخدم “Meta” الصور المرخصة من Shutterstock. هذا يسمح لها بتجنب القضايا المرتبطة بملكية الصور والاقتباس.
المنافسون في الساحة
DALL-E
هذا النموذج من الذكاء الاصطناعي من OpenAI يُمكنه إنتاج صور فريدة من نوعها من النصوص. ومع ذلك، يعتمد DALL-E على النماذج التوزيعية، والتي قد تكون أقل كفاءة من نموذج “CM3leon” القائم على الرموز.
Stable Diffusion
هي أداة أخرى شهيرة في مجال الذكاء الاصطناعي تتيح توليد الصور من النصوص. ومع ذلك، مثل DALL-E، يعتمد على نماذج التوزيع وقد لا يكون قادراً على المطابقة مع الكفاءة والجودة التي يوفرها “CM3leon”.
Midjourney
هذا النموذج أيضاً يعد منافساً لـ”CM3leon”، ولكن مثل DALL-E وStable Diffusion، فإنه يعتمد على نماذج التوزيع، وقد لا يتمتع بالتماسك العالمي الذي يتمتع به “CM3leon”.
الخلاصة
CM3leon ليس مجرد خطوة جديدة في عالم الذكاء الاصطناعي، بل هو تقدم ثوري قد يحدد الطريق إلى المستقبل. حالياً، هو جهد بحثي ولا يزال غير واضح متى أو حتى إذا كانت “Meta” ستجعل هذه التقنية متاحة للجمهور. ومع ذلك، وبالنظر إلى الأداء القوي والكفاءة العالية لـ”CM3leon”، فمن المرجح أن نرى مزيداً من التطورات في هذا المجال قريباً.