روبوتات الذكاء الاصطناعي تُصاب بالهلوسة
AI بالعربي – متابعات
ربما تكون قد استخدمت ChatGPT-4 أو أحد روبوتات الدردشة الجديدة الأخرى التي تعمل بالذكاء الاصطناعي في طرح سؤال حول صحتك، أو ربما يستخدم طبيبك ChatGPT-4 في إنشاء ملخص لما حدث في زيارتك الأخيرة، وربما يكون لدى طبيبك برنامج دردشة آلي، للتحقق من تشخيص حالتك.
ولكن في هذه المرحلة من تطوير هذه التكنولوجيا الجديدة، يقول الخبراء: سيكون من الحكمة على كل من المستهلكين والأطباء توخي الحذر، فعلى الرغم من الثقة التي يقدم بها برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي المعلومات المطلوبة، فإنه ليس دقيقًا دائمًا.
حماية من العواقب
مع الانتشار السريع لاستخدام روبوتات الدردشة المستندة إلى الذكاء الاصطناعي، سواء في مجال الرعاية الصحية أو في أماكن أخرى، كانت هناك دعوات متزايدة إلى تنظيم التكنولوجيا، لحماية الجمهور من العواقب غير المقصودة المحتملة للذكاء الاصطناعي.
تحكم
في إطار السعي لضبط الذكاء الاصطناعي، والاحتياط من المخاوف التي يثيرها، أصدر الرئيس الأمريكي جو بايدن أمرا تنفيذيا يطلب من الوكالات الحكومية التوصل إلى طرق للتحكم في استخدام الذكاء الاصطناعي.
بينما تعمل وزارة الصحة الأمريكية على إنشاء فريق عمل للرعاية الصحية يعتمد على الذكاء الاصطناعي في غضون عام، حيث سيضع فريق العمل هذا خطة لتنظيم استخدام الذكاء الاصطناعي والتطبيقات التي تدعم الذكاء الاصطناعي في تقديم الرعاية الصحية، والصحة العامة، وأبحاث وتطوير الأدوية والأجهزة الطبية، والسلامة.
وستتناول الخطة الإستراتيجية أيضًا «السلامة الطويلة المدى، ومراقبة الأداء الواقعي للتقنيات التي تدعم الذكاء الاصطناعي»، ويجب كذلك تطوير طريقة، لتحديد ما إذا كانت التقنيات التي تدعم الذكاء الاصطناعي «تحافظ على مستويات مناسبة من الجودة». وبالشراكة مع الوكالات الأخرى ومنظمات سلامة المرضى، يجب على الخدمات الصحية والإنسانية إنشاء إطار من أجل تحديد الأخطاء «الناتجة عن الذكاء الاصطناعي المنتشر في البيئات السريرية».
بلا ضوابط
تقول إيدا سيم، الحاصلة على دكتوراه في الطب أستاذة الطب والصحة الدقيقة الحسابية رئيسة قسم المعلوماتية البحثية في جامعة كاليفورنيا، إن الأمر التنفيذي الذي أصدره بايدن هو «خطوة أولى جيدة».
ويوافق على ذلك الدكتور جون دبليو آيرز، نائب مدير المعلوماتية في معهد ألتمان للأبحاث السريرية والتحويلية، حيث إنه الرغم من أن صناعة الرعاية الصحية تخضع لرقابة صارمة، فإنه لا توجد لوائح محددة بشأن استخدام الذكاء الاصطناعي في الرعاية الصحية.
وقال: «ينشأ هذا الوضع الفريد من حقيقة أن الذكاء الاصطناعي يتحرك بسرعة، ولا يستطيع المنظمون مواكبته». وأكد أنه من المهم التحرك بحذر في هذا المجال، وإلا فإن اللوائح الجديدة قد تعيق التقدم الطبي.
محاكاة مذهلة
في العام الذي انقضى منذ ظهور ChatGPT-4، أذهل الخبراء بمحادثاته الشبيهة بالبشر، ومعرفته عددا من المواضيع. وقد نجح برنامج الدردشة الآلي وغيره من البرامج المشابهة في ترسيخ أقدامها بقوة في مجال الرعاية الصحية.
%14 من الأطباء، وفقًا لأحد الاستطلاعات، يستخدمون بالفعل «وكلاء المحادثة» للمساعدة في تشخيص المرضى، ووضع خطط العلاج، والتواصل مع المرضى عبر الإنترنت. وتُستخدم روبوتات الدردشة أيضًا في جمع المعلومات من سجلات المرضى قبل الزيارات، وتلخيص ملاحظات الزيارة للمرضى.
وبدأ المستهلكون أيضًا في استخدام روبوتات الدردشة للبحث عن معلومات الرعاية الصحية، وفهم إشعارات مزايا التأمين، وتحليل الأرقام من الاختبارات المعملية.
هلوسة الروبوتات
المشكلة الرئيسة في كل هذا هي أن روبوتات الدردشة المدعمة بالذكاء الاصطناعي ليست دائمًا على حق. ففي بعض الأحيان، يخترعون أشياء غير موجودة فيصابون بالهلوسة، على حد تعبير بعض المراقبين.
ووفقا لدراسة حديثة أجرتها شركة Vectara، وهي شركة ناشئة أسسها موظفون سابقون في شركة جوجل، فإن برامج الدردشة الآلية تشكل المعلومات بـ3% على الأقل، وفي كثير من الأحيان قد تصل إلى 27%، اعتمادًا على الروبوت، وتوصل تقرير آخر إلى استنتاجات مماثلة.
هذا لا يعني أن روبوتات الدردشة ليست جيدة بشكل ملحوظ في الوصول إلى الإجابة الصحيحة في معظم الأوقات.
ففي إحدى التجارب، طرح 33 طبيبًا في 17 تخصصًا على روبوتات الدردشة 284 سؤالًا طبيًا متفاوتة التعقيد، وصنفوا إجاباتهم، فتم تصنيف أكثر من نصف الإجابات على أنها صحيحة تقريبًا أو صحيحة تمامًا. لكن الإجابات عن 15 سؤالًا تم تسجيلها على أنها غير صحيحة تمامًا.
روبوت للمعرفة الطبية
أنشأت Google روبوت دردشة يسمى Med-PaLM مصممًا خصيصًا للمعرفة الطبية. ويتمتع برنامج الدردشة الآلي هذا، الذي اجتاز اختبار الترخيص الطبي، بمعدل دقة يصل إلى 92.6% في الإجابة عن الأسئلة الطبية، وهو معدل دقة الأطباء نفسه تقريبًا، وفقًا لدراسة أجرتها Google.
وقد أجرى آيرز وزملاؤه دراسة لمقارنة استجابات برامج الدردشة الآلية والأطباء للأسئلة التي يطرحها المرضى عبر الإنترنت، وقيّم المتخصصون في مجال الصحة الإجابات، وفضلوا استجابة روبوت الدردشة على استجابة الأطباء فيما يقرب من 80% من عمليات التبادل. بينما تم تصنيف إجابات الأطباء على أنها أقل جودة وتعاطفًا، واقترح الباحثون أن الأطباء ربما كانوا أقل تعاطفا بسبب ضغوط الممارسة التي كانوا يعانونها.
أعراض غير عادية
يمكن استخدام Chatbots في تحديد التشخيصات النادرة أو شرح الأعراض غير العادية، ويمكن أيضًا استشارتها للتأكد من أن الأطباء لا يفوتون إمكانات التشخيص الواضحة. ولكي تكون متاحة لهذه الأغراض، يجب تضمينها في نظام السجلات الصحية الإلكتروني الخاص بالعيادة. وضمنت Microsoft بالفعل ChatGPT-4 في نظام السجلات الصحية الأكثر انتشارًا من Epic Systems.
أحد التحديات التي تواجه أي برنامج chatbot هو أن السجلات تحتوي على بعض المعلومات الخاطئة، وغالبًا ما تكون بيانات مفقودة. في حين ترتبط العديد من الأخطاء التشخيصية بتاريخ المريض السيئ والفحوص البدنية غير الواضحة الموثقة في السجل الصحي الإلكتروني. وعادةً، لا تتضمن هذه السجلات الكثير أو أي معلومات من سجلات الممارسين الآخرين الذين عاينوا المريض. وقال آيرز إنه بناءً على البيانات غير الكافية في سجل المريض فقط، قد يكون من الصعب على الإنسان أو الذكاء الاصطناعي استخلاص النتيجة الصحيحة في حالة معينة، وهنا يمكن أن تكون خبرة الطبيب ومعرفة المريض لا تقدر بثمن.
لكن روبوتات الدردشة جيدة جدًا في التواصل مع المرضى، كما أظهرت دراسة آيرز. وأوضح إنه مع الإشراف البشري، يبدو من المحتمل أن أدوات المحادثة هذه يمكن أن تساعد في تخفيف العبء الواقع على الأطباء في المراسلة عبر الإنترنت مع المرضى. وأفاد بأن «هذا يمكن أن يُحسن جودة الرعاية. وكيل المحادثة ليس مجرد شيء يمكنه التعامل مع البريد الوارد الخاص بك أو عبء البريد الوارد الخاص بك، بل يمكنه تحويل صندوق الوارد الخاص بك إلى صندوق صادر من خلال رسائل استباقية للمرضى.
ويمكن للروبوتات إرسال رسائل شخصية للمرضى مصممة خصيصا لسجلاتهم، وما يعتقد الأطباء أن احتياجاتهم ستكون عليه». «ماذا سيفعل ذلك للمرضى؟»، أجاب آيرز: «هناك إمكانات هائلة هنا لتغيير كيفية تفاعل المرضى مع مقدمي الرعاية الصحية».
إيجابيات وسلبيات Chatbots
إذا كان من الممكن استخدام روبوتات الدردشة في توليد رسائل للمرضى، فمن الممكن أن تلعب أيضا دورًا رئيسا في إدارة الأمراض المزمنة التي تؤثر على ما يصل إلى 60% من كل الأمريكيين.
ويشرح سيم، وهو أيضًا طبيب رعاية أولية، الأمر بهذه الطريقة: «المرض المزمن هو شيء تصاب به على مدى الساعة طول أيام الأسبوع. أرى مرضاي 20 دقيقة كل شهر في المتوسط، لذا فأنا لست الشخص الذي يقوم بمعظم إدارة الرعاية المزمنة».
وأضاف سيم: «لكنني لا أقدم أي دعم في المنزل. يمكن لروبوتات الدردشة المدعمة بالذكاء الاصطناعي بسبب قدرتها على استخدام اللغة الطبيعية أن تكون موجودة مع المرضى بطرق لا نستطيع نحن الأطباء القيام بها».
وبيّن: «إلى جانب تقديم المشورة للمرضى ومقدمي الرعاية لهم، يمكن لوكلاء المحادثة أيضا تحليل البيانات من أجهزة استشعار المراقبة، وطرح أسئلة حول حالة المريض من يوم لآخر. على الرغم من أن أيًا من هذا لن يحدث في المستقبل القريب، فإنه يمثل فرصة كبيرة».
وافق آيرز على ذلك، لكنه حذر من ضرورة إجراء تجارب عشوائية، لتحديد ما إذا كانت خدمة المراسلة المدعومة بالذكاء الاصطناعي يمكنها بالفعل تحسين نتائج المرضى.
وقال: «إذا لم نجرى علوما عامة صارمة بشأن أدوات المحادثة هذه، فيمكنني رؤية سيناريوهات تسبب الضرر».
تركيز على المريض
بشكل عام، قال آيرز إن الإستراتيجية الوطنية للذكاء الاصطناعي يجب أن تركز على المريض بدلاً من التركيز على كيفية مساعدة روبوتات الدردشة للأطباء أو تقليل التكاليف الإدارية.
من وجهة نظر المستهلك، أبدى آيرز قلقه بشأن تقديم برامج الذكاء الاصطناعي «توصيات عالمية للمرضى قد تكون غير مادية أو حتى سيئة».
وشدد سيم أيضًا على أنه لا ينبغي للمستهلكين الاعتماد على الإجابات التي تقدمها برامج الدردشة الآلية لأسئلة الرعاية الصحية، «يحتاج الأمر إلى الكثير من الحذر حوله. هذه الأشياء مقنعة جدًا في الطريقة التي تستخدم بها اللغة الطبيعية. أعتقد أنها مخاطرة كبيرة. على الأقل، يجب أن يقال للعامة: هناك روبوت دردشة خلفنا، وقد يكون هذا خطأً».
روبوتات الدردشة في الجانب الصحي
مزاياها
ـ تستطيع إجراء محادثات شبيهة بالبشر
ـ تستطيع القياد بدور «وكلاء المحادثة»، للمساعدة في تشخيص المرضى
ـ تساعد في وضع خطط العلاج
ـ تساعد في التواصل مع المرضى عبر الإنترنت
ـ تُستخدم في جمع المعلومات من سجلات المرضى قبل الزيارات
ـ تساعد في تلخيص ملاحظات الزيارة للمرضى
ـ تستخدم من قِبل المستهلكين للبحث عن معلومات الرعاية الصحية
ـ تستخدم لفهم إشعارات مزايا التأمين
ـ تستطيع تحليل الأرقام من الاختبارات المعملية.
ـ يمكن استخدامها في تحديد التشخيصات النادرة أو شرح الأعراض غير العادية
ـ يمكنها أن تلعب دور رئيسا في إدارة الأمراض المزمنة
ـ يمكنها أن تكون موجودة مع المرضى بطرق لا يستطيعها الأطباء
عيوبها
ـ ليست دقيقة دائما
ـ ليست هناك لوائح محددة بشأن استخدام الذكاء الاصطناعي في الرعاية الصحية
ـ تتحرك بسرعة، وبالتالي لا يستطيع المنظمون مواكبتها دوما
ـ تخترع أحيانًا أشياء غير موجودة كأنها تصاب بالهلوسة
ـ يمكن إن كانت البيانات غير كافية في سجل المريض أن تستخلص نتائج غير صحيحة