“OpenAI” يستخدم “Whisper” لاستخراج النصوص من مقاطع الفيديو على “يوتيوب”

"OpenAI" يستخدم "Whisper" لاستخراج النصوص من مقاطع الفيديو على "يوتيوب"

AI بالعربي – متابعات

استنفد مختبر الذكاء الاصطناعي OpenAI كل مخزونه من النصوص باللغة الإنجليزية على الإنترنت أثناء تطويره لأحدث التقنيات حيث احتاج إلى مزيد من البيانات لتدريب الإصدار التالي من أدواته. فقد أنشأ باحثو OpenAI أداة للتعرف على الكلام تسمى Whisper، حيث يمكن لهذه الأداة نسخ الصوت من مقاطع فيديو على يوتيوب، مما ينتج عنه نص محادثة جديد من شأنه أن يجعل الذكاء الاصطناعي نظاما أكثر ذكاءً. وكشف ثلاث أشخاص مطلعين على المحادثات أن بعض موظفي OpenAI ناقشوا كيف يمكن أن تتعارض هذه الخطوة مع قواعد يوتيوب. لا سيما أن موقع يوتيوب، المملوك لشركة “جوجل”، يحظر استخدام مقاطع الفيديو الخاصة به للتطبيقات المستقلة عن منصة الفيديو، بحسب تقرير لصحيفة “نيويورك تايمز”.

أكثر من مليون ساعة

ونسخ فريق OpenAI أكثر من مليون ساعة من مقاطع الفيديو على موقع يوتيوب، على حد قول الأشخاص. فيما أضاف اثنان من الأشخاص أن الفريق يضم غريغ بروكمان، رئيس OpenAI، الذي ساعد شخصياً في جمع مقاطع الفيديو. ثم تم إدخال النصوص في نظام يسمى GPT-4، والذي كان يعتبر على نطاق واسع أحد أقوى أنظمة الذكاء الاصطناعي في العالم.

تحويل المقاطع لنصوص

يذكر أن الشركة كانت قد دربت عام 2021 نماذجها على كافة مصادر البيانات المفيدة، وبحثت فكرة تحويل مقاطع الفيديو والبودكاست والكتب الصوتية في يوتيوب إلى نصوص كأفضل الموارد المتاحة للبيانات. وفي ذلك الوقت، كانت الشركة قد دربت نماذجها على بيانات تضمنت الأكواد البرمجية في منصة Github، ومحتوى الواجبات المدرسية في منصة Quizlet وغيرها.

Related Posts

دراسة تكشف عزوف الألمان عن الاعتماد على الذكاء الاصطناعي في التسوق

AI بالعربي – متابعات يخترق الذكاء الاصطناعي تفاصيل الحياة اليومية بسرعة مذهلة، بات اليوم قادرًا على اختيار حاجيات الإنسان من طعام وملابس وحتى مستلزمات النظافة الشخصية. لكن السؤال المطروح في…

الذكاء الاصطناعي على أعتاب التحول الذاتي.. هل اقتربت لحظة الانفجار؟

تشير أبحاث علمية حديثة إلى أن الذكاء الاصطناعي خلال عامين قد يمتلك القدرة على الاعتماد على ذاته من دون تدخل البشر. انتقل الذكاء الاصطناعي من مجرد أداة للترجمة وتحليل البيانات…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات

حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

  • أكتوبر 1, 2025
  • 210 views
حول نظرية القانون المشتغل بالكود “الرمز” Code-driven law

الإعلام.. و”حُثالة الذكاء الاصطناعي”

  • سبتمبر 29, 2025
  • 225 views
الإعلام.. و”حُثالة الذكاء الاصطناعي”

تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

  • سبتمبر 26, 2025
  • 150 views
تطبيقات الذكاء الاصطناعي.. وتساؤلات البشر

كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟

  • سبتمبر 24, 2025
  • 173 views
كيف يغيّر الذكاء الاصطناعي «العمليات الأمنية»؟

الذكاء الاصطناعي في قاعة التشريفات: ضيف لا مضيف

  • سبتمبر 18, 2025
  • 107 views
الذكاء الاصطناعي في قاعة التشريفات: ضيف لا مضيف

الإعلام والذكاء الاصطناعي.. ستة مصادر للقلق

  • سبتمبر 15, 2025
  • 116 views
الإعلام والذكاء الاصطناعي.. ستة مصادر للقلق