ابتكار نظام ذكاء اصطناعي ينشئ صورًا لأشخاص من خلال أصواتهم

ابتكار نظام ذكاء اصطناعي ينشئ صورًا لأشخاص من خلال أصواتهم

AI بالعربي – متابعات

كشف علماء في مختبر علوم الكمبيوتر والذكاء الاصطناعي في معهد ”ماساتشوستس“ للتكنولوجيا، عن خوارزمية ذكاء اصطناعي تدعى ”Speech2Face“، قادرة على إعادة بناء وجه شخص المتحدث بواسطة التسجيل الصوتي.

ويعمل العلماء في المعهد على الخوارزمية، منذ العام 2019، وللوصول إلى هذه التقنية، حيث قام الباحثون أولًا بتصميم وتدريب شبكة عصبية عميقة باستخدام ملايين مقاطع الفيديو على موقع يوتيوب.

وخلال المرحلة الأولى من التدريب، تمكن الذكاء الاصطناعي من معرفة الارتباط بين صوت وملامح المتحدث، ولم تكن هناك مشاركة بشرية في هذه العملية الأولى، حيث لم يحتج الباحثون إلى تسمية أي مجموعة فرعية من البيانات يدويًا.

وبهذه الطريقة، تلقى الذكاء الاصطناعي ببساطة عددًا كبيرًا من مقاطع الفيديو، واكتشف الارتباط بين ميزات الصوت وميزات الوجه.

ولمزيد من استكشاف هذه الدقة في إعادة بناء الوجه، ابتكر الباحثون وحدة فك ترميز للوجه قادرة على تشكيل وإعادة بناء موحدة لوجه الشخص من إطار ثابت مع تجاهل الاختلافات غير ذات الصلة، مثل: الوضع، والإضاءة.

وأدت الاختبارات إلى السماح للعلماء بمقارنة إعادة بناء الصوت بسهولة أكبر مع الخصائص الحقيقية للمتحدث، وبعد المرحلة الأولى، وخلال المرحلة الثانية اقتربت نتائج الذكاء الاصطناعي بشكل مدهش من شكل المتحدث الحقيقي.

ورغم النتائج المذهلة لعمل الخوارزمية، إلا أنها ليست طريقة مضمونة، نظرًا لوجود حالات أخرى واجه فيها نظام الذكاء الاصطناعي صعوبة في تحديد الصوت الذي بدأ بالفعل.

وتتسبب عوامل، مثل: اللغة، واللهجة، ونبرة الصوت، في اختلافات بين الكلام والوجه، حيث كان الجنس، والعمر، والعرق، غير صحيح تمامًا.

وأوضح الباحثون، أنهم صمموا نموذجًا للكشف عن الارتباطات الإحصائية الموجودة بين ميزات الوجه وأصوات المتحدثين، وكانت بيانات التدريب التي استخدموها عبارة عن مجموعة من مقاطع فيديو تعليمية على موقع ”يوتيوب“، ولا تمثل سكان العالم بأسره بالتساوي.

وبقدر ما يتعلق الأمر بالتطبيقات الواقعية لهذه الخوارزمية الجديدة، يمكن أن ينتهي هذا الذكاء الاصطناعي بإنشاء رسم كرتوني لشخص في مكالمة هاتفية أو مؤتمر فيديو عندما تكون هويته غير معروفة، وهي ميزة يمكن إضافتها إلى العديد من التطبيقات.

ويمكن أيضًا للنظام، تخصيص المساعدين الصوتيين المتنوعين أكثر من ذلك، حتى أنه يمنحهم صورة وجه الشخص الذي يمتلك الجهاز.

ويمكن أن تمنح هذه التقنية ميزة لقوات إنفاذ القانون والأمن لاستخدام هذا الذكاء الاصطناعي لإنشاء صورة لما يبدو عليه المشتبه به، إذا كان الدليل الوحيد الذي لديهم هو الصوت.

Related Posts

مستقبل العمل في ظل الذكاء الاصطناعي.. وظائف جديدة تولد من رحم التقنية

الصّفوة – الأخبار وسط التحولات المتسارعة في عالم العمل، تشهد الولايات المتحدة طفرة غير مسبوقة في الوظائف المستحدثة بفعل الذكاء الاصطناعي، إذ تؤكد صحيفة واشنطن بوست أنّ الموجة التقنية الجديدة…

“ميتا” ترفع مشترياتها من الطاقة الشمسية إلى أكثر من 3 جيجاوات لدعم طموحاتها في الذكاء الاصطناعي

AI بالعربي – متابعات وقّعت شركة “ميتا” ثلاث صفقات هذا الأسبوع لشراء ما يقرب من 1 جيجاوات من الطاقة الشمسية، في إطار سباقها لتشغيل طموحاتها العالية في مجال الذكاء الاصطناعي.…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 62 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 213 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

  • أكتوبر 1, 2025
  • 302 views
حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

الإعلام.. و”حُثالة الذكاء الاصطناعي”

  • سبتمبر 29, 2025
  • 312 views
الإعلام.. و”حُثالة الذكاء الاصطناعي”

تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

  • سبتمبر 26, 2025
  • 260 views
تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟

  • سبتمبر 24, 2025
  • 295 views
كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟