ابتكار نظام ذكاء اصطناعي ينشئ صورًا لأشخاص من خلال أصواتهم

ابتكار نظام ذكاء اصطناعي ينشئ صورًا لأشخاص من خلال أصواتهم

AI بالعربي – متابعات

كشف علماء في مختبر علوم الكمبيوتر والذكاء الاصطناعي في معهد ”ماساتشوستس“ للتكنولوجيا، عن خوارزمية ذكاء اصطناعي تدعى ”Speech2Face“، قادرة على إعادة بناء وجه شخص المتحدث بواسطة التسجيل الصوتي.

ويعمل العلماء في المعهد على الخوارزمية، منذ العام 2019، وللوصول إلى هذه التقنية، حيث قام الباحثون أولًا بتصميم وتدريب شبكة عصبية عميقة باستخدام ملايين مقاطع الفيديو على موقع يوتيوب.

وخلال المرحلة الأولى من التدريب، تمكن الذكاء الاصطناعي من معرفة الارتباط بين صوت وملامح المتحدث، ولم تكن هناك مشاركة بشرية في هذه العملية الأولى، حيث لم يحتج الباحثون إلى تسمية أي مجموعة فرعية من البيانات يدويًا.

وبهذه الطريقة، تلقى الذكاء الاصطناعي ببساطة عددًا كبيرًا من مقاطع الفيديو، واكتشف الارتباط بين ميزات الصوت وميزات الوجه.

ولمزيد من استكشاف هذه الدقة في إعادة بناء الوجه، ابتكر الباحثون وحدة فك ترميز للوجه قادرة على تشكيل وإعادة بناء موحدة لوجه الشخص من إطار ثابت مع تجاهل الاختلافات غير ذات الصلة، مثل: الوضع، والإضاءة.

وأدت الاختبارات إلى السماح للعلماء بمقارنة إعادة بناء الصوت بسهولة أكبر مع الخصائص الحقيقية للمتحدث، وبعد المرحلة الأولى، وخلال المرحلة الثانية اقتربت نتائج الذكاء الاصطناعي بشكل مدهش من شكل المتحدث الحقيقي.

ورغم النتائج المذهلة لعمل الخوارزمية، إلا أنها ليست طريقة مضمونة، نظرًا لوجود حالات أخرى واجه فيها نظام الذكاء الاصطناعي صعوبة في تحديد الصوت الذي بدأ بالفعل.

وتتسبب عوامل، مثل: اللغة، واللهجة، ونبرة الصوت، في اختلافات بين الكلام والوجه، حيث كان الجنس، والعمر، والعرق، غير صحيح تمامًا.

وأوضح الباحثون، أنهم صمموا نموذجًا للكشف عن الارتباطات الإحصائية الموجودة بين ميزات الوجه وأصوات المتحدثين، وكانت بيانات التدريب التي استخدموها عبارة عن مجموعة من مقاطع فيديو تعليمية على موقع ”يوتيوب“، ولا تمثل سكان العالم بأسره بالتساوي.

وبقدر ما يتعلق الأمر بالتطبيقات الواقعية لهذه الخوارزمية الجديدة، يمكن أن ينتهي هذا الذكاء الاصطناعي بإنشاء رسم كرتوني لشخص في مكالمة هاتفية أو مؤتمر فيديو عندما تكون هويته غير معروفة، وهي ميزة يمكن إضافتها إلى العديد من التطبيقات.

ويمكن أيضًا للنظام، تخصيص المساعدين الصوتيين المتنوعين أكثر من ذلك، حتى أنه يمنحهم صورة وجه الشخص الذي يمتلك الجهاز.

ويمكن أن تمنح هذه التقنية ميزة لقوات إنفاذ القانون والأمن لاستخدام هذا الذكاء الاصطناعي لإنشاء صورة لما يبدو عليه المشتبه به، إذا كان الدليل الوحيد الذي لديهم هو الصوت.

Related Posts

“الصين” تدعو إلى إنشاء هيئة عالمية لتنظيم الذكاء الاصطناعي خلال قمة أبيك

AI بالعربي – متابعات دعا الرئيس الصيني شي جين بينغ إلى تأسيس هيئة عالمية تُعنى بتنظيم الذكاء الاصطناعي، خلال اجتماع قادة منتدى التعاون الاقتصادي لدول آسيا والمحيط الهادئ (أبيك) يوم…

الذكاء الاصطناعي يُعيد تشكيل صناعة الألعاب عالميًا

AI بالعربي – متابعات يتجه الذكاء الاصطناعي لإحداث تحوّل جذري في صناعة الألعاب، مؤثّرًا على مليارات اللاعبين حول العالم، بحسب ما أكده مين ليانغ تان، الرئيس التنفيذي والمؤسس المشارك لشركة…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 65 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 215 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

  • أكتوبر 1, 2025
  • 306 views
حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

الإعلام.. و”حُثالة الذكاء الاصطناعي”

  • سبتمبر 29, 2025
  • 315 views
الإعلام.. و”حُثالة الذكاء الاصطناعي”

تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

  • سبتمبر 26, 2025
  • 263 views
تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟

  • سبتمبر 24, 2025
  • 297 views
كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟