أخبار عاجلة

كيف يمكن للنهج الأثري أن يساعد في الاستفادة من البيانات المتحيزة في الذكاء الاصطناعي لتحسين الطب

يفتقر المثل الكلاسيكي لعلوم الكمبيوتر “القمامة إلى الداخل، القمامة إلى الخارج” إلى الفروق الدقيقة عندما يتعلق الأمر بفهم البيانات الطبية المتحيزة، كما يقول أساتذة علوم الكمبيوتر وأخلاقيات علم الأحياء من معهد ماساتشوستس للتكنولوجيا، وجامعة جونز هوبكنز، ومعهد آلان تورينج في معهد ماساتشوستس للتكنولوجيا، وجامعة جونز هوبكنز، ومعهد آلان تورينج. مقال رأي جديد نشرت في العدد الأخير من نيو انغلاند جورنال اوف ميديسين (نيم).

أدت الشعبية المتزايدة للذكاء الاصطناعي إلى زيادة التدقيق في مسألة نماذج الذكاء الاصطناعي المتحيزة، مما أدى إلى التمييز الخوارزمي، والذي حدده مكتب البيت الأبيض للعلوم والتكنولوجيا باعتباره قضية رئيسية في مخططه الأخير لوثيقة حقوق الذكاء الاصطناعي.

عند مواجهة بيانات متحيزة، خاصة بالنسبة لنماذج الذكاء الاصطناعي المستخدمة في البيئات الطبية، فإن الاستجابة النموذجية هي إما جمع المزيد من البيانات من المجموعات الممثلة تمثيلا ناقصا أو إنشاء بيانات تركيبية تعوض الأجزاء المفقودة لضمان أداء النموذج بشكل جيد على قدم المساواة عبر مجموعة من مجموعات المرضى. لكن المؤلفين يجادلون بأن هذا النهج الفني يجب تعزيزه بمنظور اجتماعي تقني يأخذ العوامل الاجتماعية التاريخية والحالية في الاعتبار. ومن خلال القيام بذلك، يمكن للباحثين أن يكونوا أكثر فعالية في معالجة التحيز في الصحة العامة.

“لقد ناقشنا ثلاثتنا الطرق التي نتعامل بها غالبًا مع المشكلات المتعلقة بالبيانات من منظور التعلم الآلي باعتبارها إزعاجات تحتاج إلى التعامل معها من خلال حل تقني،” تتذكر المؤلفة المشاركة مرضية قاسمي، الأستاذ المساعد في الهندسة الكهربائية والهندسة الكهربائية. علوم الكمبيوتر وهي شركة تابعة لعيادة عبد اللطيف جميل للتعلم الآلي في مجال الصحة (عيادة جميل)، ومختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL)، ومعهد الهندسة والعلوم الطبية (IMES).

“لقد استخدمنا تشبيهات البيانات باعتبارها قطعة أثرية تعطي رؤية جزئية للممارسات السابقة، أو مرآة متشققة تحمل انعكاسًا. في كلتا الحالتين ربما لا تكون المعلومات دقيقة أو مواتية تمامًا: ربما نعتقد أننا نتصرف بطرق معينة “كمجتمع – ولكن عندما تنظر فعليًا إلى البيانات، فإنها تحكي قصة مختلفة. قد لا نحب هذه القصة، ولكن بمجرد اكتشاف فهم للماضي، يمكنك المضي قدمًا واتخاذ خطوات لمعالجة الممارسات السيئة.”

في ورقتهم البحثية التي تحمل عنوان “النظر إلى البيانات المتحيزة كأدوات إعلامية في الرعاية الصحية المدعومة بالذكاء الاصطناعي”، يطرح قاسمي وخديجة فيرمان وماكسين ماكينتوش قضية النظر إلى البيانات السريرية المتحيزة على أنها “عناصر فنية” بنفس الطريقة التي ينظر بها علماء الأنثروبولوجيا أو علماء الآثار إلى البيانات المادية. الأشياء: أجزاء من الممارسات التي تكشف عن الحضارة، وأنظمة المعتقدات، والقيم الثقافية – في حالة البحث، وتحديدًا تلك التي أدت إلى عدم المساواة القائمة في نظام الرعاية الصحية.

على سبيل المثال، أظهرت دراسة أجريت عام 2019 أن الخوارزمية التي تعتبر على نطاق واسع معيارا صناعيا تستخدم نفقات الرعاية الصحية كمؤشر على الحاجة، مما أدى إلى استنتاج خاطئ مفاده أن المرضى السود الأكثر مرضا يحتاجون إلى نفس المستوى من الرعاية مثل المرضى البيض الأكثر صحة. ما وجده الباحثون هو فشل التمييز الخوارزمي في تفسير عدم المساواة في الحصول على الرعاية.

في هذه الحالة، بدلاً من النظر إلى مجموعات البيانات المتحيزة أو نقص البيانات باعتبارها مشاكل لا تتطلب سوى التخلص منها أو إصلاحها، توصي قاسمي وزملاؤها بنهج “المنتجات” كوسيلة لرفع مستوى الوعي حول العناصر الاجتماعية والتاريخية التي تؤثر على كيفية جمع البيانات والحلول البديلة. طرق تطوير الذكاء الاصطناعي السريري.

يقول قاسمي: “إذا كان الهدف من نموذجك هو نشره في بيئة سريرية، فيجب عليك إشراك متخصص في أخلاقيات علم الأحياء أو طبيب حاصل على التدريب المناسب في وقت مبكر بشكل معقول في صياغة المشكلة”. “باعتبارنا علماء كمبيوتر، ليس لدينا في كثير من الأحيان صورة كاملة عن العوامل الاجتماعية والتاريخية المختلفة التي ساهمت في إنشاء البيانات التي سنستخدمها. نحن بحاجة إلى الخبرة في تمييز الحالات التي قد لا تعمل فيها النماذج المعممة من البيانات الموجودة بشكل جيد بالنسبة لنا.” مجموعات فرعية محددة.”

يعترف المؤلفون بأن أحد الجوانب الأكثر تحديًا في تنفيذ النهج القائم على القطع الأثرية هو القدرة على تقييم ما إذا كانت البيانات قد تم تصحيحها عنصريًا: أي استخدام أجساد الذكور البيض كمعيار تقليدي يتم قياس الأجسام الأخرى وفقًا له. يستشهد مقال الرأي بمثال من جمعية أمراض الكلى المزمنة في عام 2021، والتي طورت معادلة جديدة لقياس وظائف الكلى لأن المعادلة القديمة قد تم “تصحيحها” سابقًا في ظل الافتراض الشامل بأن الأشخاص السود لديهم كتلة عضلية أعلى. يقول قاسمي إنه يجب على الباحثين أن يكونوا مستعدين لدراسة التصحيح على أساس العرق كجزء من عملية البحث.

في آخر ورقة حديثة مقبولة لهذا العام المؤتمر الدولي للتعلم الآلي شارك في تأليف دكتوراه قاسمي. الطالب فينيث سورياكومار والأستاذ المساعد بجامعة كاليفورنيا في سان دييغو بيرك أوستون، وجد الباحثون أن افتراض تضمين السمات الشخصية مثل العرق المبلغ عنه ذاتيًا يؤدي إلى تحسين أداء نماذج تعلم الآلة يمكن أن يؤدي في الواقع إلى نتائج ونماذج ومقاييس أسوأ للأقليات. والسكان الأقليات.

“لا يوجد حل واحد صحيح بشأن ما إذا كان يجب إدراج العرق المبلغ عنه ذاتيًا في درجة المخاطر السريرية أم لا. العرق المبلغ عنه ذاتيًا هو بناء اجتماعي يعد وكيلًا لمعلومات أخرى، ويمثل نفسه بشكل عميق في البيانات الطبية الأخرى. الحل “يجب أن يتناسب مع الأدلة”، يشرح قاسمي.

هذا لا يعني أنه يجب تكريس مجموعات البيانات المتحيزة، أو أن الخوارزميات المتحيزة لا تتطلب إصلاحًا – فبيانات التدريب عالية الجودة لا تزال أساسية لتطوير نماذج ذكاء اصطناعي سريرية آمنة وعالية الأداء، وتسلط مقالة NEJM الضوء على دور المعاهد الوطنية للذكاء الاصطناعي. الصحة (NIH) في قيادة الممارسات الأخلاقية.

صرح لورانس تاباك، القائم بأعمال مدير المعاهد الوطنية للصحة، في بيان صحفي عندما أعلنت المعاهد الوطنية للصحة عن برنامج Bridge2AI الذي تبلغ تكلفته 130 مليون دولار في العام الماضي، أن “إنشاء مجموعات بيانات عالية الجودة ومن مصادر أخلاقية أمر بالغ الأهمية لتمكين استخدام تقنيات الذكاء الاصطناعي من الجيل التالي التي تغير طريقة إجراء الأبحاث”. .

شاهد أيضاً

اكتشاف الآلية المشاركة في التهاب الأسنان يمهد الطريق للعلاجات ضد فقدان العظام

من خلال التجارب على الفئران، توصل الباحثون إلى اكتشافات حول الآليات المرتبطة بالتهاب لب الأسنان …