تكشف نماذج الذكاء الاصطناعي لعلم الأمراض عن التحيزات الديموغرافية في تشخيص السرطان

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

لقد كان علم الأمراض منذ فترة طويلة حجر الزاوية في تشخيص السرطان وعلاجه. يقوم أخصائي علم الأمراض بفحص جزء رفيع للغاية من الأنسجة البشرية تحت المجهر بحثًا عن أدلة تشير إلى وجود السرطان ونوعه ومرحلته. بالنسبة للخبير البشري، فإن النظر إلى عينة من الأنسجة الوردية المليئة بالخلايا الأرجوانية هو...

تكشف نماذج الذكاء الاصطناعي لعلم الأمراض عن التحيزات الديموغرافية في تشخيص السرطان

لقد كان علم الأمراض منذ فترة طويلة حجر الزاوية في تشخيص السرطان وعلاجه. يقوم أخصائي علم الأمراض بفحص جزء رفيع للغاية من الأنسجة البشرية تحت المجهر بحثًا عن أدلة تشير إلى وجود السرطان ونوعه ومرحلته.

بالنسبة للخبير البشري، فإن النظر إلى عينة من الأنسجة الوردية الملتوية المنقطة بالخلايا الأرجوانية يشبه تصحيح امتحان بدون اسم عليه - فالشريحة تكشف معلومات أساسية عن المرض دون تقديم مزيد من التفاصيل حول المريض.

ومع ذلك، لا ينطبق الأمر نفسه بالضرورة على نماذج الذكاء الاصطناعي في علم الأمراض التي ظهرت في السنوات الأخيرة. أظهرت دراسة جديدة أجراها فريق من كلية الطب بجامعة هارفارد أن هذه النماذج يمكن أن تستنتج بطريقة أو بأخرى المعلومات الديموغرافية من شرائح علم الأمراض، مما يؤدي إلى تحيز تشخيص السرطان في مجموعات سكانية مختلفة.

ومن خلال تحليل العديد من نماذج الذكاء الاصطناعي الرئيسية لعلم الأمراض لتشخيص السرطان، وجد الباحثون أداءً غير متساوٍ في اكتشاف السرطان والتمييز بين مجموعات سكانية مختلفة بناءً على الجنس والعرق والعمر الذي أبلغ عنه المرضى ذاتيًا. وحددوا عدة تفسيرات محتملة لهذا التحيز الديموغرافي.

ثم قام الفريق بتطوير إطار عمل يسمى FAIR-Path، والذي ساعد في تقليل التحيز في النماذج.

تعتبر قراءة البيانات الديموغرافية من شريحة علم الأمراض "مهمة مستحيلة" بالنسبة لأخصائي علم الأمراض البشري، لذلك كان التحيز في الذكاء الاصطناعي في علم الأمراض مفاجأة لنا."

كون شينج يو، كبير المؤلفين، وأستاذ مشارك في المعلوماتية الطبية الحيوية، معهد بلافاتنيك في HMS وأستاذ مساعد في علم الأمراض في HMS في مستشفى بريجهام والنساء

وقال يو إن اكتشاف ومكافحة تحيز الذكاء الاصطناعي في الطب أمر بالغ الأهمية لأنه يمكن أن يؤثر على دقة التشخيص وكذلك نتائج المرضى. يُظهر نجاح FAIR-Path أن الباحثين قادرون على تحسين عدالة نماذج الذكاء الاصطناعي لأمراض السرطان، وربما نماذج الذكاء الاصطناعي الأخرى في الطب، بأقل جهد.

تم وصف العمل، المدعوم جزئيًا بالتمويل الفيدرالي، في 16 ديسمبرتقارير الخلية الطب.

تحقق من التحيز

قام يو وفريقه بفحص التحيز في أربعة نماذج قياسية لعلم أمراض الذكاء الاصطناعي تم تطويرها لتقييم السرطان. تم تدريب نماذج التعلم العميق هذه على مجموعات من شرائح علم الأمراض المشروحة، والتي "تعلموا" منها الأنماط البيولوجية التي تسمح لهم بتحليل شرائح جديدة وإجراء التشخيص.

وقام الباحثون بتغذية نماذج الذكاء الاصطناعي بأرشيف كبير مشترك بين المؤسسات يضم شرائح علم الأمراض من 20 نوعًا من السرطان.

ووجدوا أن النماذج الأربعة جميعها قد انحرفت في الأداء وقدمت تشخيصات أقل دقة للمرضى في مجموعات معينة على أساس العرق والجنس والعمر المبلغ عنها ذاتيا. على سبيل المثال، واجهت النماذج صعوبة في التمييز بين الأنواع الفرعية لسرطان الرئة لدى المرضى الأمريكيين من أصل أفريقي والذكور والأنواع الفرعية لسرطان الثدي لدى المرضى الأصغر سنًا. واجهت النماذج أيضًا صعوبة في اكتشاف سرطان الثدي والكلى والغدة الدرقية والمعدة لدى بعض السكان. حدثت هذه الاختلافات في الأداء في حوالي 29 بالمائة من المهام التشخيصية التي تؤديها النماذج.

وقال يو إن عدم الدقة في التشخيص يرجع إلى أن هذه النماذج تستخرج المعلومات الديموغرافية من الشرائح، وتعتمد على أنماط ديموغرافية محددة للتشخيص.

وأضاف يو أن النتائج كانت غير متوقعة "لأننا كنا نتوقع تقييماً مرضياً موضوعياً". "عند تقييم الصور، لا نحتاج بالضرورة إلى معرفة التركيبة السكانية للمريض لإجراء التشخيص."

وتساءل الفريق: لماذا لم يظهر الذكاء الاصطناعي في علم الأمراض نفس الموضوعية؟

تبحث عن تفسيرات

وتوصل الباحثون إلى ثلاثة تفسيرات.

ولأنه من الأسهل على المرضى في مجموعات سكانية معينة الحصول على العينات، يتم تدريب نماذج الذكاء الاصطناعي على أحجام عينات غير متساوية. وهذا يزيد من صعوبة قيام النماذج بإجراء تشخيص دقيق في العينات التي لم يتم تمثيلها بشكل جيد في مجموعة التدريب، مثل تلك الخاصة بمجموعات الأقليات على أساس العرق أو العمر أو الجنس.

وقال يو: "لكن المشكلة كانت أعمق بكثير". لاحظ الباحثون أن أداء النماذج كان في بعض الأحيان أسوأ في مجموعة سكانية، حتى عندما كانت أحجام العينات متشابهة.

ووجد تحليل إضافي أن هذا قد يكون بسبب الاختلافات في انتشار المرض: بعض أنواع السرطان أكثر شيوعًا في مجموعات معينة، مما يجعل النماذج أفضل في إجراء التشخيص في تلك المجموعات. ونتيجة لذلك، قد تواجه النماذج صعوبة في تشخيص السرطان لدى المجموعات السكانية التي لا تكون شائعة فيها.

تلتقط نماذج الذكاء الاصطناعي أيضًا الاختلافات الجزيئية الدقيقة في عينات من مجموعات ديموغرافية مختلفة. على سبيل المثال، يمكن للنماذج اكتشاف الطفرات في الجينات المسببة للسرطان واستخدامها كبديل لنوع السرطان، وبالتالي فهي أقل فعالية في إجراء التشخيص في المجموعات السكانية حيث تكون هذه الطفرات أقل شيوعًا.

وقال يو: "لقد وجدنا أن قوة الذكاء الاصطناعي تسمح له بالتمييز بين العديد من الإشارات البيولوجية غير الواضحة التي لا يمكن اكتشافها بالتفسير البشري العادي".

وهذا يسمح للنماذج بتعلم الإشارات التي ترتبط بالتركيبة السكانية أكثر من المرض. وهذا بدوره يمكن أن يؤثر على قدراتهم التشخيصية عبر المجموعات.

يقول يو إن هذه التفسيرات مجتمعة تشير إلى أن التحيز في الذكاء الاصطناعي في علم الأمراض لا يأتي فقط من الجودة المتغيرة لبيانات التدريب، ولكن أيضًا من الطريقة التي يدرب بها الباحثون النماذج.

العثور على حل

وبعد تقييم مدى وأسباب هذا التحيز، شرع يو وفريقه في حل المشكلة.

قام الباحثون بتطوير FAIR-Path، وهو إطار عمل بسيط يعتمد على مفهوم التعلم الآلي الموجود والذي يسمى التعلم المتباين. يضيف التعلم التقابلي عنصرًا إلى تدريب الذكاء الاصطناعي الذي يعلم النموذج التركيز على الاختلافات بين الفئات المهمة - في هذه الحالة السرطان - والتقليل من أهمية الاختلافات بين الفئات الأقل أهمية - في هذه الحالة المجموعات الديموغرافية.

عندما طبق الباحثون إطار FAIR-Path على النماذج التي اختبروها، أدى ذلك إلى تقليل الاختلافات التشخيصية بنحو 88 بالمائة.

وقال يو: "لقد أظهرنا أنه من خلال هذا التعديل البسيط، يمكن للنماذج أن تتعلم ميزات قوية تجعلها أكثر قابلية للتعميم والعدالة بين مختلف المجموعات السكانية".

وأضاف أن النتيجة مشجعة، لأنها تشير إلى إمكانية تقليل التحيزات حتى بدون تدريب النماذج على بيانات تمثيلية وعادلة تمامًا.

بعد ذلك، يتعاون يو وفريقه مع مؤسسات في جميع أنحاء العالم لفحص مدى التحيز في الذكاء الاصطناعي في علم الأمراض في المواقع ذات التركيبة السكانية المختلفة والممارسات السريرية وعلم الأمراض المختلفة. إنهم يستكشفون أيضًا طرقًا لتوسيع FAIR-Path إلى الإعدادات ذات أحجام العينات المحدودة. بالإضافة إلى ذلك، يريدون دراسة كيف يساهم التحيز في الذكاء الاصطناعي في التناقضات الديموغرافية في الرعاية الصحية ونتائج المرضى.

وقال يو إن الهدف في النهاية هو إنشاء نماذج ذكاء اصطناعي عادلة وغير متحيزة في علم الأمراض يمكنها تحسين علاج السرطان من خلال مساعدة علماء الأمراض البشرية على إجراء التشخيص بسرعة ودقة.

وقال: "أعتقد أن هناك أمل في أنه إذا كنا أكثر وعيًا وحرصًا في تطوير أنظمة الذكاء الاصطناعي، فيمكننا تطوير نماذج تعمل بشكل جيد في أي مجموعة سكانية".


مصادر:

Journal reference:

لين، S.-Y.،وآخرون. (2025). التعلم المقارن يعزز العدالة في أنظمة الذكاء الاصطناعي في علم الأمراض. تقارير الخلية الطب. دوى:10.1016/j.xcrm.2025.102527.  https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00600-7