نماذج ذكاء اصطناعي تستنسخ صور الناس وأعمالا محفوظة الحقوق

15

AI بالعربي – متابعات

خلال تصفحك مواقع التواصل الاجتماعي، عرجت على الأغلب بإحدى الصور أو اللوحات الفنية التي أنتجتها أنظمة ذكية شائعة لإنشاء الصور قائمة على ما يسمى الذكاء الاصطناعي التوليدي” (Generative AI ). للوهلة الأولى، تنسى أنك أمام أدوات من صنع الإنسان وتشعر أنها موهبة قائمة بحد ذاتها تعي فعلاً ما تصنعه. جل ما عليك أنت فعله كتابة بضع كلمات تصف فيها مبتغاك.

اليوم، وجد بحث تناولته المجلة العلمية الإلكترونية “أم آي تي تكنولوجي ريفيو” التابعة لـ”معهد ماساتشوستس للتكنولوجيا”، أن تلك التقنيات تملك، عند توجيهها، المقدرة على إنشاء صور لأشخاص موجودين أصلاً، بدلاً من إنشاء صورة جديدة تماماً، ما يتهدد ربما خصوصية هؤلاء.

كذلك يكشف البحث أن في المستطاع حمل أنظمة الذكاء الاصطناعي هذه على إنتاج نسخ طبق الأصل، كما لو أنها تجترها أو تجتافها، من صور طبية وأعمال لفنانين محمية بحقوق الطبع والنشر. عليه، يقدم هذا الاكتشاف حججاً إضافية تدعم وجهة نظر فنانين يقاضون حالياً شركات الذكاء الاصطناعي بسبب انتهاكها حقوق الطبع والنشر، وفق زعمهم.

نهض بالدراسة باحثون في مجال التكنولوجيا، تحديداً “جوجل” وشركة “ديب مايند” DeepMind للذكاء الاصطناعي، وفي الحقل الجامعي تحديداً “جامعة كاليفورنيا بيركلي” UC Berkeley و”جامعة برينستون” Princeton، و”المعهد الفيدرالي للتكنولوجيا في زيوريخ” ETH Zürich. خلص هؤلاء إلى نتائجهم من طريق تلقين النظامين “ستيبل ديفيوجن” Stable Diffusion، و”إيماجن” Imagen من “غوغل” شروحات توضيحية للصور، من قبيل تكرار اسم الشخص مرات عدة. وفي مرحلة لاحقة، حللوا ما إذا كانت أي من الصور التي أنشأتها الأداتان تتطابق مع صور أصلية موجودة في قاعدة بيانات النموذج. وفي النتيجة، استخرجت مجموعة الباحثين أكثر من 100 نسخة طبق الأصل من الصور في مجموعة التدريب الخاصة بالذكاء الاصطناعي الذي يستخدم التعلم العميق.

جدير بالذكر أن “ستيبل ديفيوجن” نموذج مفتوح المصدر طرحته الشركة الناشئة “ستابيليتي أي آي” Stability AI المتخصصة في الذكاء الاصطناعي للجمهور مجاناً، لذا يمكن لأي كان دراسته. أما “إيماجن” الذي لم يعد مفتوح المصدر فقد منحت “غوغل” الباحثين إمكانية الدخول إليه.

معلوم أن نماذج الذكاء الاصطناعي المولدة للصور هذه تتدرب على مجموعات ضخمة من البيانات تتكون من صور ذات أوصاف نصية مأخوذة من الإنترنت. يعمل الجيل الأحدث من هذه التقنية من طريق أخذ صور في مجموعة البيانات وتغيير بكسل واحد، علماً أن الصورة الرقمية تتألف من مصفوفة بكسلات، مرة تلو الأخرى حتى تصير الصورة الأصلية مجرد مجموعة من وحدات البكسل العشوائية. في المرحلة التالية، يعكس نموذج الذكاء الاصطناعي اتجاه العملية بغية تحويل فوضى البكسلات إلى صورة جديدة.

وفق “إم آي تي تكنولوجي ريفيو”، تمثل الورقة البحثية المرة الأولى التي يثبت فيها الباحثون أن نماذج الذكاء الاصطناعي هذه تحفظ الصور في مجموعات التدريب الخاصة بها، كما يقول رايان ويبستر، طالب في مرحلة الدكتوراه في “جامعة كان نورماندي” في فرنسا، والذي درس الخصوصية في نماذج ذكية أخرى لتوليد الصور، ولكنه لم يشارك في البحث. عليه، يبدو جلياً أن هذه الحقيقة ربما تترك تأثيراتها على الشركات الناشئة الراغبة في استخدام نماذج من “الذكاء الاصطناعي التوليدي” في الرعاية الصحية، ذلك أن البحث يكشف أن هذه الأنظمة تنطوي على خطر تسريب معلومات خاصة حساسة.

بناء على نتائج البحث، يأمل إريك والاس، طالب دكتوراه في “جامعة كاليفورنيا بيركلي” وأحد الباحثين في مجموعة الدراسة، وزملاؤه في دق ناقوس الخطر بشأن مشكلات الخصوصية المحتملة الكامنة في نماذج الذكاء الاصطناعي هذه، وذلك قبل طرحها على نطاق واسع في قطاعات حساسة مثل الطب، داعياً إلى اتخاذ إجراءات وقائية شديدة للحؤول دون انتهاك الخصوصية.

وليس بالنبأ الجديد أن الفنانين ليسوا على وفاق مع شركات الذكاء الاصطناعي بسبب نماذج الذكاء الاصطناعي هذه البارعة في حفظ الصور من قواعد بياناتها وإعادة استخدامها. مثلاً، تواجه “ستابيليتي. أي آي” دعوتين قضائيتين من مجموعة فنانين و”غيتي إيماجز” التي تزعم أن الشركة أخذت وعالجت بشكل غير قانوني مواد خاصة بها محمية بحقوق الطبع والنشر.

لذا، توفر نتائج الباحثين أدلة إضافية تدعم موقف الفنانين الذين يتهمون شركات الذكاء الاصطناعي بانتهاك حقوق النشر. وإذا نجح الفنانون الذين اُستخدمت أعمالهم لتدريب “ستيبل ديفيوجن” في إثبات أن هذا النموذج المدعوم بالذكاء الاصطناعي قد نسخ أعمالهم من دون إذن، سيتعين على الشركة دفع تعويضات لهم.

لما كان الباحثون لم يستخرجوا سوى عدد قليل نسبياً من نسخ الصور الطبق الأصل للأفراد من نموذج الذكاء الاصطناعي: نسخة واحدة فقط من كل مليون صورة. ربما ينظر مطورو الذكاء الاصطناعي في هذه الدراسة ويرون أن المخاطر لا تذكر. ولكن البحث أظهر أنه كلما ازدادت أنظمة الذكاء الاصطناعي ضخامة وتعقيداً، يرتفع احتمال إنتاجها مواد منسوخة أو مستنسخة.

ونسأل، إذا أراد باحث ما إنشاء مجموعة كاملة من بيانات طبية خاصة بالأشعة السينية لعدد من الأشخاص مثلاً، ما الذي سيحدث إذا كان الذكاء الاصطناعي يحفظ عن ظهر قلب سجلات طبية خاصة بشخص واحد ويعيد تكرارها؟ الهدف من هذه الدراسة استباق تلك الأنواع المحتملة من الأخطاء. ولكن هذه المحاذير المترتبة على اجتياف أعمال أخرى، لم يحل دون نجاح الذكاء الاصطناعي من طريق استخدام برنامج اسمه “ميدجورني” Midjourney في “رسم” لوحة فازت بجائزة في سبتمبر (أيلول) 2022. وأثارت هذه الحادثة جدلاً كبيراً لم تنته فصوله بعد، فهل للذكاء الاصطناعي القدرة على إبداع فني “أصيل” أم لا، أهو يتمتع بقدرات مستقلة عن صانعيه ويسعه التغريد في معزل عن توجيهات البشر وأعمالهم السابقة؟

اترك رد

Your email address will not be published.