الذكاء الاصطناعي يحيي أصوات الموتى لتسجيل كتب مسموعة

45

AI بالعربي – متابعات

“موت الراوي”، عنوان اختارته صحيفة “غارديان” لأحد مقالاتها في بداية 2023، متحدثة فيه عن نهاية قريبة تتهدد الراويين البشر للكتب المسموعة، هذه السوق المربحة والآخذة في النمو، وذلك بعد إعلان شركة “أبل” إطلاق مجموعة من الكتب الصوتية يتولى قراءتها نموذج من الذكاء الاصطناعي. اليوم، تتحدث مقالات كثيرة عن “إحياء” الراوي بعدما أطلقت شركة متخصصة بالكتب الصوتية تسمى “ديب زين” DeepZen في لندن مشروعاً جديداً لها في هذه الصناعة.

اختارت الشركة إدوارد هيرمان، صاحب أكثر الأصوات شهرة في هوليوود بعدما حصلت على حق الوصول إلى تسجيلاته السابقة بإذن من عائلته. اشتهر الممثل الأميركي بأدواره في أفلام مثل “آني” Annie و”ريدز” Reds و”ذا بيربل روز أوف كايرو” The Purple Rose of Cairo، وفي مسلسلات تلفزيونية عدة من بينها، “ذا براكتس” The Practice و”غيلمور غيرلز”Gilmore Girls . ولكن الأهم أنه كان أيضاً قارئ كتب مسموعة غزير الإنتاج. ومن المتوقع إصدار كتاب بصوته لاحقا خلال العام الحالي هو “الحرب مع المكسيك” The War with Mexico بقلم جوستين أتش سميث الفائز بجائزة “بوليتزر” عن فئة التاريخ عام 1920. ولكن كيف يكون ذلك وقد فارق هيرمان الحياة منذ 10 سنوات تقريبا؟

لقد أعيد إنشاء صوت هيرمان عبر نموذج من الذكاء الاصطناعي يستفيد من مقاطع صوتية سابقة له، ويستخدمها في رواية كتب صوتية جديدة، على ما ذكرت “وول ستريت جورنال” في تقرير نشرته في هذا الشأن.

نقلت الصحيفة عن روري هيرمان، ابن هيرمان وصاحب مطعم في لوس أنجليس، قوله إن العائلة ارتأت أن “هذه الطريقة خطوة رائعة للحفاظ على إرث [هيرمان]”، متحدثاً عن دهشة اعترته عندما استمع للمرة الأولى إلى كتاب مسموع يظهر فيه صوت والده الذي ولّده ذكاء اصطناعي.

على الموقع الإلكتروني لشركة “ديب زين” تجد قائمة بأصوات عدد من رواة الكتب المسموعة للاختيار من بينها. هناك، تجد هيرمان مدرجاً ببساطة باسم “إدوارد”، مع عينة من صوته تقول، “أعجوبة التكنولوجيا اليوم تعني أن في مقدورنا إنشاء أصوات شبيهة بالبشر باستخدام الذكاء الاصطناعي. على رغم أنني، إدوارد، شخص حقيقي، غير أن الكلمات التي أقولها قد ولدها جهاز كمبيوتر”.

إنه الذكاء الاصطناعي التوليدي Generative AI ، من منا لم يسمع أو يقرأ عن هذا الشكل من التكنولوجيا القادرة على إنشاء أنواع مختلفة من المحتوى، بما في ذلك نصوص وصور وأصوات، لا سيما بعد إطلاق روبوت الدردشة المؤتمت  GPTChat من شركة Open AI  في أواخر العام الماضي. بين عشية وضحاها، أصبح برنامج الدردشة الآلي، الذي يجيب ببلاغة عن أي سؤال، وعلى نحو خاطئ جداً أحياناً- ظاهرة عالمية، ما أثار توقعات بأن الذكاء الاصطناعي عموماً قد يقلب مهناً كثيرة رأساً على عقب.

واحدة من تلك المهن السرد المسموع، وليس وصول الذكاء الاصطناعي إلى هذا القطاع مجرد كلام. فشركات مثل “جوجل” و”أبل” تستخدمه فعلاً لرواية الكتب الصوتية، ولكن الاعتماد على أصوات رواة وافتهم المنية يبقى حتى الآن ظاهرة جديدة.

وقد ذكرت “أبل” و”جوجل” أنهما تسمحان للمستخدمين بإنشاء كتب صوتية مجانا تستخدم أصواتا بشرية مستنسخة رقميا. مصدر الأصوات المعروضة في كتب صوتية أنشأتها الشركتان أشخاص حقيقيون، وساعدت أصواتهم في تدريب محركات السرد الآلي.

وقال تشارلز واتكينسون، مدير “مطبعة جامعة ميشيغان”، إن الأخيرة قد أنتجت نحو 100 كتاب صوتي باستخدام النظام الأساسي المجاني للكتب الصوتية المروية تلقائيا من “جوجل” منذ أوائل العام الماضي. فالتكنولوجيا الجديدة جعلت توفير تلك العناوين ممكنا لأنها ألغت التكاليف المرتبطة باستخدام استوديو الإنتاج وموظفي الدعم والرواة البشريين.

“يمكنني أن أرى أن رواة الكتب المسموعة مذعورون”، قالت ديما أبراموف، الرئيسة التنفيذية لشركة “سبيتشكي”  Speechk المنتجة للكتب الصوتية باستخدام أصوات مروية اصطناعياً، مقرها أوستن في ولاية تكساس الأميركية.

وسجل سكوت بريك بصوته أكثر من ألف كتاب صوتي لمؤلفين مثل توم كلانسي، الروائي الأميركي الشهير بقصص التجسس والعلوم العسكرية، ونيلسون ديميل الأميركي المعروف برواياته التي تمزج ببراعة شديدة بين الأحداث الخيالية والحقيقية. في رأيه، السرد التلقائي للذكاء الاصطناعي تناسبه العناوين غير الخيالية، حيث لا يستثمر الرواة والقراء عاطفياً خلافاً للحال في الأعمال الخيالية.

من وجهة نظر بريك، ينطوي السرد بالذكاء الاصطناعي على واقعية، ولكن الروح تغيب عنه ولا نبض يسري فيه.

أما تايلان كاميس، الرئيس التنفيذي والمؤسس المشارك لشركة “ديب زين”، فيقول إن الأخيرة قد تعاونت مع أكثر من 30 ممثلاً محترفاً لمساعدة محرك الذكاء الاصطناعي الخاص بها على التقاط جميع نطاقات المشاعر الإنسانية.

أحد هؤلاء ميليسا بابل، الممثلة المولودة في باريس، التي روت أنها سجلت ثماني ساعات من المحتوى لـ”ديب زين”، وهي تقرأ بالفرنسية من كتب مختلفة. “استدعاني أحدها لأن أقرأ بطريقة غاضبة، وآخر بطريقة مقززة، وغيره بطريقة فكاهية، كذلك بطريقة درامية”.

في رأي بابيل، ما زال يتوافر كثير من العمل للرواة المحترفين لأن العصر الجديد من السرد التلقائي للذكاء الاصطناعي بدأ للتو، مع أن هذه الحال ستختلف في المستقبل، على ما أضافت.

“فهمت أنهم سيستخدمون صوتي لتعليم البرمجيات كيفية التحدث بشكل أكثر إنسانية. لم أكن أدرك أنهم يستطيعون استخدام صوتي لنطق كلمات لم أقلها. هذا لا يصدق”، قالت بابل.

تدفع “ديب زين” للرواة الذين تتعامل معهم مبالغ ثابتة بالإضافة إلى عائدات أخرى بناءً على الإيرادات التي تحققها الشركة من مشاريع مختلفة. وقال كاميس إن الاتفاقيات تمتد لسنوات عدة.

ولكن جيفري بينيت، المستشار العام لنقابة ممثلي الشاشة ورابطة فناني التلفزيون والراديو الأميركيين، الذي يمثل أيضاً رواة الكتب الصوتية المحترفين، يتخوف من أن يقود الذكاء الاصطناعي إلى تعطيل هذا القطاع في نهاية المطاف.

يستخدم الذكاء الاصطناعي الذي أنشأته “ديب زين” برنامج تعلم آليا يستنسخ طريقة كلام شخص ما، بالإضافة إلى خصائص صوته. قال كاميس إن النظام يضمن طريقة سرده شيئاً من العواطف ويصب تركيزه على الكلمات التي يصعب نطقها، من قبيل أسماء الشخصيات في روايات الخيال العلمي أو أصغر المدن في الصين.

في رأيه، “تبقى هذه الطريقة أسهل من الاستعانة براو بشري”. ولا ننسى أن إنتاج كتاب مسموع بصوت إنسان يستغرق أسابيع، ويكلف الناشرين آلاف الدولارات، في حين يعد إغراء الذكاء الاصطناعي بخفض التكاليف، لذا تسعى “ديب زين”، التي أنتجت نحو مئة كتاب صوتي بصوت هيرمان، إلى الحصول على حقوق استخدام أصوات نجوم آخرين متوفين. وبين “موت الراوي” و”إحياء الراوي”، يبدو أن دفة الميزان تميل في الحالين لمصلحة الراوي الاصطناعي وليس الراوي الإنسان.

المصدر: independentarabia
اترك رد

Your email address will not be published.