كنز من البيانات الصحية يساعد الذكاء الاصطناعي على التنبؤ بالأمراض
AI بالعربي – متابعات
أطلق زياد أوبرماير، طبيب وعالم التعلم الآلي في جامعة كاليفورنيا، بيركلي، برنامج نايتينجيل أوبن ساينس الشهر الماضي -كنز دفين من مجموعات البيانات الطبية الفريدة، كل منها منسق حول لغز طبي لم يتم حله ويمكن للذكاء الاصطناعي أن يساعد على حله.
يمكن أن تساعد مجموعات البيانات، التي تم إصدارها بعد أن تلقى المشروع تمويلا يبلغ مليوني دولار من الرئيس التنفيذي السابق لشركة جوجل، إريك شميدت، في تدريب خوارزميات الكمبيوتر على التنبؤ بالحالات الطبية في وقت مبكر، وعلاجها بشكل أفضل وإنقاذ الأرواح.
وتشتمل البيانات على 40 تيرابايت من الصور الطبية، مثل الأشعة السينية وأشكال الموجات الكهربائية للقلب وعينات علم الأمراض، من مرضى يعانون مجموعة من الحالات، بما فيها سرطان الثدي عالي الخطورة، والسكتة القلبية المفاجئة، والكسور وكوفيد- 19. وتلصق على كل صورة النتائج الطبية للمريض، مثل مرحلة سرطان الثدي وما إذا كان قد أدى إلى الوفاة، أو ما إذا كان مريض كوفيد بحاجة إلى جهاز التنفس الصناعي.
جعل أوبرماير استخدام مجموعات البيانات مجانيا وعمل بشكل رئيس مع المستشفيات في الولايات المتحدة وتايوان لبنائها على مدار عامين. وهو يخطط لتوسيع هذا ليشمل كينيا ولبنان في الأشهر المقبلة ليعكس أكبر قدر ممكن من التنوع الطبي.
وقال أوبرماير، الذي أعلن المشروع الجديد في كانون الأول (ديسمبر) إلى جانب زملائه في نيور آي بي إس، المؤتمر الأكاديمي العالمي للذكاء الاصطناعي، “لا يوجد شيء مثله. ما يميز هذا عن أي شيء متاح على الإنترنت هو أن مجموعات البيانات موسومة “بالحقيقة الأساسية”، ما يعني ما حدث بالفعل للمريض وليس فقط رأي الطبيب”.
إن هذا يعني أن مجموعات البيانات الخاصة بتخطيط كهربية القلب أثناء توقفه، على سبيل المثال، لم يتم تضمينها في الملصق اعتمادا على ما إذا كان طبيب القلب قد اكتشف شيئا مريبا، ولكن فيما إذا كان هذا المريض قد أصيب بنوبة قلبية في النهاية. فقد قال أوبرماير، “يمكننا التعلم من النتائج الفعلية للمرضى، بدلا من تكرار الحكم البشري المعيب”.
في العام الماضي، شهد مجتمع الذكاء الاصطناعي تحولا على مستوى القطاع من جمع “البيانات الضخمة” – أكبر قدر ممكن من البيانات – إلى بيانات ذات مغزى، أو معلومات أكثر تنسيقا وملاءمة لمشكلة معينة، يمكن استخدامها لمعالجة مسائل مثل التحيزات البشرية الراسخة في الرعاية الصحية، أو التعرف على الصور أو معالجة اللغة الطبيعية.
حتى الآن، ثبت أن عديدا من خوارزميات الرعاية الصحية تعمل على تضخيم التمايزات الصحية الحالية. فعلى سبيل المثال، وجد أوبرماير أن نظام الذكاء الاصطناعي الذي تستخدمه المستشفيات ويعالج ما يصل إلى 70 مليون أمريكي، خصص دعما طبيا إضافيا للمرضى الذين يعانون أمراضا مزمنة، وكان يعطي الأولوية للمرضى البيض الأكثر صحة على السود الأكثر مرضا الذين كانوا يحتاجون إلى المساعدة. وكانت ترتب المخاطر بناء على البيانات التي تضمنت إجمالي تكاليف الرعاية الصحية للفرد في العام. لقد كان النموذج يستخدم تكاليف الرعاية الصحية كبديل لاحتياجات الرعاية الصحية.
إن لب هذه المشكلة، الذي انعكس في البيانات الأساسية للنموذج، هو أن كل شخص لا يولد تكاليف الرعاية الصحية بالطريقة نفسها. فقد تفتقر الأقليات وغيرهم من السكان المحرومين إلى الوصول إلى الرعاية الصحية والموارد الخاصة بها، وقد تكون أقل قدرة على الحصول على إجازة من العمل لزيارات الأطباء، أو تعاني التمييز داخل النظام من خلال تلقي عدد أقل من العلاجات أو الاختبارات، ما قد يؤدي إلى تصنيفهم على أنهم أقل تكلفة في مجموعات البيانات. وهذا لا يعني بالضرورة أنهم أقل مرضا.
وقدر الباحثون أنه كان ينبغي إحالة ما يقرب من 47 في المائة من المرضى السود للحصول على رعاية إضافية، لكن التحيز الخوارزمي يعني أن 17 في المائة فقط تمت إحالتهم.
وقال أوبرماير، “ستكون تكاليف رعايتك أقل على الرغم من أن احتياجاتك هي نفسها. لقد كان هذا هو أساس التحيز الذي وجدناه”. ووجد أن عديدا من أنظمة الذكاء الاصطناعي المشابهة الأخرى تستخدم التكلفة كبديل، وهو قرار يقدر أنه يؤثر في حياة نحو 200 مليون مريض.
على عكس مجموعات البيانات المستخدمة على نطاق واسع في علم بصريات الكمبيوتر كقاعدة البيانات المسماة بـإميج نيت، التي تم تصميمها باستخدام صور من الإنترنت لا تعكس بالضرورة تنوع العالم الحقيقي، تشمل مجموعة وافرة من مجموعات البيانات الجديدة معلومات أكثر تمثيلا للسكان، ما ينتج عنها ليس فقط نطاق تطبيق أوسع ودقة أكبر للخوارزميات، ولكن أيضا في توسيع معرفتنا العلمية.
وقال شميدت، الذي مولت مؤسسته مشروع نايتينجيل أوبن ساينس إنه يمكن لهذه البيانات المتنوعة الجديدة وذات الجودة العالية أن تستخدم لاجتثاث التحيزات الأساسية “التمييزية من ناحية أولئك المحرومين وغير الممثلين” في أنظمة الرعاية الصحية، كالنساء والأقليات. وأضاف أن “بالإمكان استخدام الذكاء الاصطناعي لفهم ما يحدث بالفعل مع الإنسان، بدلا مما يعتقده الطبيب.”
كانت مجموعات بيانات مشروع نايتينجيل من بين العشرات المقترحة هذا العام في مؤتمر نيور آي بي إس.
وشملت المشاريع الأخرى مجموعة بيانات الكلام من لغة الماندرين وثماني لغات فرعية مسجلة من قبل 27 ألف متحدث في 34 مدينة في الصين، أكبر مجموعة من البيانات الصوتية لأصوات الجهاز التنفسي لكوفيد، مثل التنفس والسعال والتسجيلات الصوتية، من أكثر من 36 ألف مشارك للمساعدة على تشخيص المرض، ومجموعة بيانات من صور الأقمار الاصطناعية تغطي كامل دولة جنوب إفريقيا من 2006 إلى 2017، مقسمة ومصنفة حسب الحي، لدراسة الآثار الاجتماعية للتمييز العنصري المكاني.
وقالت إلين نسويزي، عالمة الأوبئة الحاسوبية في كلية الصحة العامة في جامعة بوسطن، إن أنواعا جديدة من البيانات يمكن أن تساعد أيضا على دراسة انتشار الأمراض في مواقع متنوعة، حيث يتفاعل الأشخاص من ثقافات مختلفة بشكل مختلف مع الأمراض.
وقالت إن جدتها في الكاميرون، على سبيل المثال، قد تفكر بشكل مختلف عما قد يفكر فيه الأمريكيون فيما يتعلق بالصحة. “إذا كان شخص ما مصابا بمرض شبيه بالإنفلونزا في الكاميرون، فقد يبحث عن العلاجات العشبية أو العلاجات المنزلية التقليدية، مقارنة بالعقاقير أو العلاجات المنزلية المختلفة في الولايات المتحدة”.
وأشار عالما الحاسوب سيرينا يونغ وهواكين فانشورين، اللذان اقترحا أن يتم تبادل الأبحاث لبناء مجموعات بيانات جديدة في مؤتمر نيور آس بي إس، إلى أن الأغلبية العظمى من مجتمع الذكاء الاصطناعي لا تزال غير قادرة على العثور على مجموعات بيانات جيدة لتقييم الخوارزميات الخاصة بهم. وقالا إن هذا يعني أنه لا يزال باحثو الذكاء الاصطناعي يتجهون إلى البيانات التي من المحتمل أن تكون “مليئة بالتحيز”. فلا توجد نماذج جيدة دون بيانات جيدة.”