“ميتا” تطلق تقنية جديد تستغني عن العنصر البشري في تدريبات الذكاء الاصطناعي

5

AI بالعربي – متابعات

أعلنت شركة “ميتا”، عن نموذج ذكاء اصطناعي يعلم نفسه والآخرين بشكل أساسي دون ردود فعل بشرية، جاء ذلك بعد أن أصبح الذكاء الاصطناعي متوفرًا في كل مكان في الوقت الحاضر، فقد رحبت العديد من شركات التكنولوجيا بالذكاء الاصطناعي كما أنشأ البعض نماذجهم الخاصة بدلًا من الاستفادة من نماذج الشركات الأخرى.

كل ماتريد معرفته عن تقنية Self-Taught Evaluator

تعد ميتا واحدة من اللاعبين الكبار في عالم التكنولوجيا، وقد أعلنت الآن عن نموذج ذكاء اصطناعي جديد يسمى “Self-Taught Evaluator” والهدف منه هو تقييم وتدريب نماذج الذكاء الاصطناعي الأخرى بشكل مستقل، خاصة أن تدريب الذكاء الاصطناعي مسعى مكلف للغاية، وهو سباق صعب للغاية في الوقت الحالي مع كل المنافسة.

ويستخدم المطورون تقنية تُسمى “التعلم التعزيزي من ردود الفعل البشرية”، أو ما يُشار إليه باسم RLAIF، لتدريب نماذج الذكاء الاصطناعي.

وتحتاج هذه التقنية إلى ردود فعل بشرية، وهذا يمكن أن يؤدي إلى عملية أبطأ، حيث تعمل ميتا على هذا الأمر من خلال “المقيِّم الذاتي التعلم” الجديد.

كيف تعمل هذه التقنية الجديدة؟

وأكد المطورون أن ردود الفعل البشرية ضرورية لضمان أن الذكاء الاصطناعي الذي في طور التطوير يقدم إجابات دقيقة وموثوقة، كما يتحقق من الأخطاء في معالجة البيانات، ومع ذلك، فإن النموذج الجديد قادر على تقييم وتدريب نماذج أخرى، وهو يستخدم تقنية تُسمى “سلسلة الأفكار” التي استخدمتها OpenAI في نماذج o1.

وتعالج تقنية “سلسلة الأفكار” المشكلات المعقدة من خلال تقسيمها إلى خطوات منطقية أصغر، وهذا يجعل الذكاء الاصطناعي يقدم إجابات أكثر دقة للمشكلات العلمية أو البرمجية أو الرياضية، كما تم تطوير نموذج ميتا الجديد باستخدام هذه التقنية.

وبهذه الطريقة، يتدرب الذكاء الاصطناعي على البيانات التي يولدها الذكاء الاصطناعي.

اترك رد

Your email address will not be published.