تحليل تعبيرات الوجه.. أبرز ميزات النموذج الجديد لـ”ChatGPT”

AI بالعربي – متابعات

كشفت شركة “OpenAI”، مؤخرًا، عن ميزات النموذج الجديد للذكاء الاصطناعي لـ”ChatGPT”، الذي يفهم المشاعر، ويحلّل تعبيرات وجه المستخدمين، ويعالج المدخلات بشكل أسرع؛ بالإضافة إلى تحديث الواجهة التي تمكن المستخدم من التفاعل مع برنامج المحادثة الآلية.

Introducing GPT-4o, our new model which can reason across text, audio, and video in real time.

It's extremely versatile, fun to play with, and is a step towards a much more natural form of human-computer interaction (and even human-computer-computer interaction): pic.twitter.com/VLG7TJ1JQx

— Greg Brockman (@gdb) May 13, 2024

وقالت مديرة فريق التكنولوجيا لدى الشركة “ميرا موراتي”، في حديث لها حول النموذج الجديد، إن التحديث الذي صدر لنموذج الذكاء الاصطناعي يجعل “GPT – 4o” متاحًا للجميع، وبشكل مجاني.

وأضافت أن النموذج الجديد سيكون أسرع بكثير، مع إمكانات محسنة في التفاعل مع النصوص والفيديو والصوت، حيث تخطط “OpenAI” في النهاية لتمكين المستخدمين من إجراء محادثة فيديو مع تطبيق “ChatGPT”.

وذكرت المسؤولة أن النموذج الجديد يسمح لـ”ChatGPT” بالتعامل مع 50 لغة مختلفة وتحسين السرعة والجودة؛ مضيفة أنه يجعله متاحًا أيضًا عبر واجهة برمجة التطبيقات الخاصة بـ”OpenAI” حتى يتمكّن المطورون من إنشاء التطبيقات الخاصة بهم باستخدام النموذج الجديد على الفور. ووفقًا للإعلان، سيكون النموذج الجديد متعدد القدرات في معالجة النصوص المكتوبة والصوتية والفيديو والصور، بشكل سريع جدًا وبتكلفة بسيطة.

من جانب آخر، قال “مارك تشين” الباحث لدى “OpenAI”، إن النموذج لديه القدرة على “إدراك المشاعر”، ويمكنه أيضًا التعامل مع المستخدمين الذين يقاطعونه؛ إذ طُلب منه خلال الحدث تحليل تعبيرات وجه المستخدم والتعليق على المشاعر التي قد يمر بها أحد الأشخاص.

والنموذج قادر على الاستجابة للمطالب الصوتية للمستخدمين في أقل من 232 مللي ثانية في بعض الأوقات، وبمتوسط 320 مللي ثانية، وهو مشابه لوقت الاستجابة البشرية في المحادثات، ويمكنه تغيير نبرة صوته وترجمة اللغات المختلفة حتى في الوضع الصوتي. وأظهر النموذج أيضًا قدرة على حل المعادلات الرياضية والمساعدة في كتابة التعليمات البرمجية.