MONET: أداة جديدة للذكاء الاصطناعي تعمل على تحسين التصوير الطبي من خلال التعلم العميق وتحليل النصوص
أداة الذكاء الاصطناعي الجديدة MONET تُحدث ثورة في التصوير الطبي من خلال التعلم العميق وتحليل النصوص - تعرف على المزيد حول الدراسة الرائدة في Nature Medicine.

MONET: أداة جديدة للذكاء الاصطناعي تعمل على تحسين التصوير الطبي من خلال التعلم العميق وتحليل النصوص
في دراسة حديثة نشرت في مجلة Nature Medicine، طور الباحثون النموذج الأساسي لـ Medical Concept Retriever (MONET)، الذي يجمع الصور الطبية مع النص ويقيم الصور بناءً على وجود الفكرة، وهو ما يساعد في المهام الحاسمة في تنفيذ الذكاء الاصطناعي الطبي (AI).
خلفية
يتطلب بناء أنظمة ذكاء اصطناعي طبي موثوقة تعتمد على الصور تحليل المعلومات ونماذج الشبكات العصبية في كل مستوى من مستويات التطوير، بدءًا من مرحلة التدريب وحتى مرحلة ما بعد النشر.
يمكن لمجموعات البيانات الطبية المشروحة الغنية بالأفكار ذات الصلة لغويًا أن تزيل الغموض عن تقنيات "الصندوق الأسود".
إن فهم المصطلحات المهمة سريريًا مثل التصبغ الداكن وشبكات الصبغ غير النمطية والألوان المتعددة يعد مفيدًا طبيًا. ومع ذلك، فإن الحصول على الملصقات أمر شاق ومعظم مجموعات المعلومات الطبية تحتوي فقط على ملاحظات تشخيصية.
حول الدراسة
في الدراسة الحالية، قام الباحثون بتطوير MONET، وهو نموذج للذكاء الاصطناعي يمكنه إضافة تعليقات توضيحية إلى الصور الطبية بأفكار ذات صلة طبيًا. لقد صمموا النموذج لتحديد الأفكار المختلفة التي يمكن للإنسان فهمها في طريقتين للصور في طب الأمراض الجلدية: الصور التنظيرية والسريرية.
جمع الباحثون 105,550 زوجًا من الصور والنصوص المتعلقة بالأمراض الجلدية من مقالات PubMed والكتب المدرسية الطبية، ثم قاموا بتدريب MONET على 105,550 صورة للأمراض الجلدية وبيانات باللغة الطبيعية من قاعدة بيانات كبيرة للأدبيات الطبية.
تقوم MONET بتعيين تصنيفات للصور لكل فكرة، مما يشير إلى مدى عكس الصورة للفكرة.
استنادًا إلى التعلم المتباين، يعد MONET أسلوبًا للذكاء الاصطناعي يتيح التطبيق المباشر لأوصاف النص العادي على الصور.
تتجنب هذه الطريقة وضع العلامات اليدوية وتمكن معلومات زوج الصور والنص الغنية على نطاق أكبر بكثير مما هو ممكن في التعلم الخاضع للإشراف. بعد تدريب MONET، قام الباحثون بتقييم فعاليته في التعليقات التوضيحية وحالات الاستخدام الأخرى المتعلقة بشفافية الذكاء الاصطناعي.
اختبر الباحثون قدرات شرح مفهوم MONET من خلال اختيار الصور الأكثر مفاهيمية من الصور التنظيرية والسريرية.
قاموا بمقارنة أداء MONET مع استراتيجيات التعلم الخاضعة للإشراف والتي تم فيها تدريب نماذج ResNet-50 باستخدام تسميات الحقيقة الأساسية المفاهيمية ونموذج التدريب المسبق للغة والصور التباينية (CLIP) الخاص بـ OpenAI.
استخدم الباحثون أيضًا MONET لأتمتة تحليل البيانات واختبروا فعاليتها في تحليل اختلاف المفاهيم.
استخدموا MONET لتحليل البيانات من التعاون الدولي لتصوير الجلد (ISIC)، وهي أكبر مجموعة صور تنظير الجلد مع أكثر من 70.000 صورة متاحة للجمهور تُستخدم بشكل روتيني لتدريب نماذج الذكاء الاصطناعي للأمراض الجلدية.
قام الباحثون بتطوير تدقيق نموذجي باستخدام MONET (MA-MONET)، والذي يستخدم MONET للكشف تلقائيًا عن المفاهيم الطبية ذات الصلة لغويًا وأخطاء النماذج.
قام الباحثون بتقييم MONET-MA في بيئات العالم الحقيقي من خلال تدريب نماذج CNN على بيانات من جامعات متعددة وتقييم شرح المفهوم الآلي الخاص بهم.
وقاموا بمقارنة طريقة تسجيل الأفكار الآلية "MONET + CBM" مع طريقة وضع العلامات البشرية، والتي تنطبق حصريًا على الصور التي تحتوي على ملصقات SkinCon.
قام الباحثون أيضًا بفحص تأثير اختيار المفهوم على أداء MONET+CBM، وخاصةً على الأفكار ذات الصلة بالمهمة في طبقات عنق الزجاجة. بالإضافة إلى ذلك، قاموا بتقييم تأثير دمج مفهوم اللون الأحمر في عنق الزجاجة على أداء MONET+CBM في سيناريوهات النقل بين المؤسسات.
نتائج
MONET عبارة عن منصة طبية مرنة تعمل بالذكاء الاصطناعي يمكنها التعليق بشكل مناسب على الأفكار في صور الأمراض الجلدية كما تم التحقق منها من قبل أطباء الأمراض الجلدية المعتمدين.
تتيح ميزة التعليق التوضيحي للمفهوم تقييمات الجدارة بالثقة ذات الصلة عبر خط أنابيب الذكاء الاصطناعي الطبي، والتي يتم إثباتها من خلال عمليات تدقيق النماذج وتدقيق البيانات وتطوير النماذج القابلة للتفسير.
نجحت MONET في العثور على صور تنظير الجلد والسريرية المناسبة لمختلف الكلمات الرئيسية للأمراض الجلدية وتتفوق على نموذج CLIP الأساسي في كلا المجالين. تفوقت MONET على CLIP في الصور السريرية والتنظير الجلدي وظلت مكافئة لنماذج التعلم الخاضعة للإشراف على الصور السريرية.
تساعد ميزة التعليقات التوضيحية الآلية في MONET على تحديد السمات المميزة بين أي مجموعتين من الصور بلغة يمكن قراءتها بواسطة الإنسان أثناء تحليل اختلاف الأفكار.
وجد الباحثون أن MONET يكتشف الأفكار المعبر عنها بشكل مختلف في مجموعات البيانات السريرية والتنظير الجلدي ويمكن أن يساعد في فحص مجموعات البيانات الكبيرة.
باستخدام MA-MONET، تم الكشف عن ميزات مرتبطة بمعدل خطأ مرتفع، مثل مجموعة من الصور تحمل اسم "الحجاب الأزرق والأبيض"، و"الأزرق"، و"الأسود"، و"الرمادي"، و"المسطح".
حدد الباحثون المجموعة ذات أعلى معدل فشل بناءً على الحمامي، وبنية الانحدار، والاحمرار، والضمور، وفرط التصبغ. اختار أطباء الجلد عشرة أفكار ذات صلة بالهدف لطبقات عنق الزجاجة MONET+CBM وCLIP+CBM التي تتيح خيارات وضع العلامات المرنة.
يتفوق أداء MONET+CBM على جميع خطوط الأساس في المنطقة المتوسطة تحت منحنى خصائص تشغيل المستقبِل (AUROC) للتنبؤ بالأورام الخبيثة والورم الميلانيني في الصور السريرية. كان أداء نماذج الصندوق الأسود الخاضعة للإشراف أفضل باستمرار في اختبارات التنبؤ بالسرطان والورم الميلانيني.
دبلوم
وجدت الدراسة أن نماذج الصور والنص يمكن أن تزيد من شفافية وموثوقية الذكاء الاصطناعي في المجال الطبي. يمكن لـ MONET، وهي عبارة عن منصة لشرح المفاهيم الطبية، تحسين الشفافية والمصداقية في الذكاء الاصطناعي للأمراض الجلدية من خلال تمكين التعليقات التوضيحية للأفكار على نطاق واسع.
يمكن لمطوري نماذج الذكاء الاصطناعي تحسين ممارسات جمع البيانات ومعالجتها وتحسينها، مما يؤدي إلى نماذج ذكاء اصطناعي طبية أكثر موثوقية.
يمكن أن تؤثر MONET على الاستخدام السريري ومراقبة أنظمة الذكاء الاصطناعي للصور الطبية من خلال تمكين التدقيق الكامل وتحليل العدالة من خلال شرح واصفات لون البشرة.
مصادر:
-
كيم، سي.، جادجيل، إس.يو.، ديجريف، أ.ج.،وآخرون.(2024) صورة طبية شفافة الذكاء الاصطناعي عبر نموذج أساس الصورة والنص القائم على الأدبيات الطبية. نات ميد.دوي: https://doi.org/10.1038/s41591-024-02887-x. https://www.nature.com/articles/s41591-024-02887-x