ابتكار نظام ذكاء اصطناعي ينشئ صورًا لأشخاص من خلال أصواتهم

ابتكار نظام ذكاء اصطناعي ينشئ صورًا لأشخاص من خلال أصواتهم

AI بالعربي – متابعات

كشف علماء في مختبر علوم الكمبيوتر والذكاء الاصطناعي في معهد ”ماساتشوستس“ للتكنولوجيا، عن خوارزمية ذكاء اصطناعي تدعى ”Speech2Face“، قادرة على إعادة بناء وجه شخص المتحدث بواسطة التسجيل الصوتي.

ويعمل العلماء في المعهد على الخوارزمية، منذ العام 2019، وللوصول إلى هذه التقنية، حيث قام الباحثون أولًا بتصميم وتدريب شبكة عصبية عميقة باستخدام ملايين مقاطع الفيديو على موقع يوتيوب.

وخلال المرحلة الأولى من التدريب، تمكن الذكاء الاصطناعي من معرفة الارتباط بين صوت وملامح المتحدث، ولم تكن هناك مشاركة بشرية في هذه العملية الأولى، حيث لم يحتج الباحثون إلى تسمية أي مجموعة فرعية من البيانات يدويًا.

وبهذه الطريقة، تلقى الذكاء الاصطناعي ببساطة عددًا كبيرًا من مقاطع الفيديو، واكتشف الارتباط بين ميزات الصوت وميزات الوجه.

ولمزيد من استكشاف هذه الدقة في إعادة بناء الوجه، ابتكر الباحثون وحدة فك ترميز للوجه قادرة على تشكيل وإعادة بناء موحدة لوجه الشخص من إطار ثابت مع تجاهل الاختلافات غير ذات الصلة، مثل: الوضع، والإضاءة.

وأدت الاختبارات إلى السماح للعلماء بمقارنة إعادة بناء الصوت بسهولة أكبر مع الخصائص الحقيقية للمتحدث، وبعد المرحلة الأولى، وخلال المرحلة الثانية اقتربت نتائج الذكاء الاصطناعي بشكل مدهش من شكل المتحدث الحقيقي.

ورغم النتائج المذهلة لعمل الخوارزمية، إلا أنها ليست طريقة مضمونة، نظرًا لوجود حالات أخرى واجه فيها نظام الذكاء الاصطناعي صعوبة في تحديد الصوت الذي بدأ بالفعل.

وتتسبب عوامل، مثل: اللغة، واللهجة، ونبرة الصوت، في اختلافات بين الكلام والوجه، حيث كان الجنس، والعمر، والعرق، غير صحيح تمامًا.

وأوضح الباحثون، أنهم صمموا نموذجًا للكشف عن الارتباطات الإحصائية الموجودة بين ميزات الوجه وأصوات المتحدثين، وكانت بيانات التدريب التي استخدموها عبارة عن مجموعة من مقاطع فيديو تعليمية على موقع ”يوتيوب“، ولا تمثل سكان العالم بأسره بالتساوي.

وبقدر ما يتعلق الأمر بالتطبيقات الواقعية لهذه الخوارزمية الجديدة، يمكن أن ينتهي هذا الذكاء الاصطناعي بإنشاء رسم كرتوني لشخص في مكالمة هاتفية أو مؤتمر فيديو عندما تكون هويته غير معروفة، وهي ميزة يمكن إضافتها إلى العديد من التطبيقات.

ويمكن أيضًا للنظام، تخصيص المساعدين الصوتيين المتنوعين أكثر من ذلك، حتى أنه يمنحهم صورة وجه الشخص الذي يمتلك الجهاز.

ويمكن أن تمنح هذه التقنية ميزة لقوات إنفاذ القانون والأمن لاستخدام هذا الذكاء الاصطناعي لإنشاء صورة لما يبدو عليه المشتبه به، إذا كان الدليل الوحيد الذي لديهم هو الصوت.

Related Posts

“RIVERSIDE” أداة فعالة لتسجيل البودكاست وتحريره باحترافية باستخدام الذكاء الاصطناعي

AI بالعربي – خاص تُعد “RIVERSIDE” منصة متخصصة في تسجيل البودكاست والفيديو عن بُعد، وتعتمد بشكل واضح على تقنيات الذكاء الاصطناعي في عدد من وظائفها الأساسية، مثل التفريغ النصي، واستخراج…

دراسة حديثة تكشف تراجع قدرة البشر على التمييز بين الصوت الحقيقي وصوت الذكاء الاصطناعي

AI بالعربي – متابعات أظهرت دراسة علمية حديثة أن التمييز بين الصوت البشري والصوت المولَّد بالذكاء الاصطناعي أصبح أكثر صعوبة لدى المستخدمين. يعكس هذا التطور التقدم السريع في تقنيات توليد…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

  • نوفمبر 29, 2025
  • 406 views
الذكاء الاصطناعي يشكل اقتصاداتنا.. ما النتائج؟

الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

  • نوفمبر 22, 2025
  • 438 views
الذكاء الاصطناعي يؤجج حرب التضليل الإعلامي

الذكاء الاصطناعي أَضحى بالفعل ذكيًا

  • نوفمبر 10, 2025
  • 542 views
الذكاء الاصطناعي أَضحى بالفعل ذكيًا

في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

  • نوفمبر 8, 2025
  • 616 views
في زمن التنظيمات: هل تستطيع السعودية أن تكتب قواعد لعبة الذكاء الاصطناعي؟

“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

  • أكتوبر 30, 2025
  • 603 views
“تنانين الذكاء الاصطناعي” في الصين وغزو العالم

الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر

  • أكتوبر 12, 2025
  • 702 views
الذكاء الاصطناعي في الحياة المعاصرة.. ثورة علمية بين الأمل والمخاطر