Štúdie ukazujú, že tepelné mapy výbežkov ešte nemusia byť pripravené na hlavný vysielací čas
Modely umelej inteligencie, ktoré interpretujú lekárske snímky, sľubujú zlepšenie schopnosti lekárov robiť presné a včasné diagnózy a zároveň znížiť pracovné zaťaženie tým, že zaneprázdneným lekárom umožnia sústrediť sa na kritické prípady a delegovať rutinné úlohy na AI. Ale modely AI, ktorým chýba transparentnosť v tom, ako a prečo sa robí diagnóza, môžu byť problematické. Tento nepriehľadný argument -; tiež známy ako „čierna skrinka“ AI -; môže znížiť dôveru lekára v spoľahlivosť nástroja AI a tým odradiť od jeho používania. Tento nedostatok transparentnosti by mohol tiež viesť lekárov k tomu, aby prehliadali interpretáciu...

Štúdie ukazujú, že tepelné mapy výbežkov ešte nemusia byť pripravené na hlavný vysielací čas
Modely umelej inteligencie, ktoré interpretujú lekárske snímky, sľubujú zlepšenie schopnosti lekárov robiť presné a včasné diagnózy a zároveň znížiť pracovné zaťaženie tým, že zaneprázdneným lekárom umožnia sústrediť sa na kritické prípady a delegovať rutinné úlohy na AI.
Ale modely AI, ktorým chýba transparentnosť v tom, ako a prečo sa robí diagnóza, môžu byť problematické. Tento nepriehľadný argument -; tiež známy ako „čierna skrinka“ AI -; môže znížiť dôveru lekára v spoľahlivosť nástroja AI a tým odradiť od jeho používania. Tento nedostatok transparentnosti by mohol tiež viesť lekárov k tomu, aby dôverovali interpretácii nástroja.
V oblasti lekárskeho zobrazovania boli hodnotenia význačnosti spôsobom, ako vytvoriť zrozumiteľnejšie modely AI a demystifikovať rozhodovanie AI -; Prístup, ktorý pomocou tepelných máp zisťuje, či sa nástroj správne zameriava iba na relevantné časti daného obrázka alebo či sa zameriava na jeho nepodstatné časti.
Teplotné mapy fungujú tak, že zvýrazňujú oblasti na obrázku, ktoré ovplyvnili interpretáciu modelu AI. To by mohlo pomôcť ľudským lekárom zistiť, či sa model AI zameriava na rovnaké oblasti ako oni, alebo sa nesprávne zameriava na irelevantné miesta na obrázku.
Nová štúdia publikovaná 10. októbra v Nature Machine Intelligence však ukazuje, že napriek všetkému, čo sľubujú, tepelné mapy význačnosti ešte nie sú pripravené na hlavný vysielací čas.
Analýza, ktorú viedol vyšetrovateľ z Harvardskej lekárskej fakulty Pranav Rajpurkar, Matthew Lungren zo Stanfordu a Adriel Saporta z New York University, kvantifikovala platnosť siedmich široko používaných metód zvýrazňovania, aby určila, ako spoľahlivo a presne dokážu identifikovať patológie spojené s 10 bežne diagnostikovanými stavmi pomocou röntgenového obrazu, ako sú pľúcne lézie, pleurálne výpotky alebo zväčšené kardiálne štruktúry. Na určenie výkonu výskumníci porovnávali výkon nástrojov s ľudským odborným úsudkom.
V konečnom dôsledku nástroje, ktoré používali významné tepelné mapy založené na tepelných mapách, mali v porovnaní s ľudskými rádiológmi konzistentne nedostatočnú výkonnosť pri hodnotení obrazu a ich schopnosti odhaliť patologické lézie.
Práca predstavuje prvú komparatívnu analýzu medzi mapami výbežkov a ľudským expertným výkonom pri hodnotení viacerých rádiografických patológií. Štúdia tiež poskytuje podrobné pochopenie toho, či a ako môžu určité patologické znaky na obrázku ovplyvniť výkon nástrojov AI.
Funkciu mapy význačnosti už používajú ako nástroj na zabezpečenie kvality klinické praxe, ktoré používajú AI na interpretáciu metód detekcie pomocou počítača, ako napríklad: B. Čítanie röntgenových snímok hrudníka. Ale vzhľadom na nové zistenia si túto funkciu treba podľa vedcov užívať opatrne a so zdravou dávkou skepticizmu.
Naša analýza ukazuje, že mapy význačnosti ešte nie sú dostatočne spoľahlivé na overenie individuálnych klinických rozhodnutí uskutočnených modelom AI. Identifikovali sme dôležité obmedzenia, ktoré vyvolávajú vážne bezpečnostné obavy pri používaní v súčasnej praxi.“
Pranav Rajpurkar, odborný asistent biomedicínskej informatiky, HMS
Výskumníci upozorňujú, že kvôli dôležitým obmedzeniam identifikovaným v štúdii by sa tepelné mapy založené na význačnosti mali ďalej zdokonaľovať predtým, ako sa široko používajú v klinických modeloch AI.
Úplná kódová základňa, údaje a analýzy tímu sú otvorené a dostupné každému, kto má záujem preskúmať tento dôležitý aspekt klinického strojového učenia v aplikáciách lekárskeho zobrazovania.
Zdroj:
Referencia:
Saporta, A., a kol. (2022) Porovnávacie metódy význačnosti pre interpretáciu rádiografu hrudníka. Inteligencia príroda-stroj. doi.org/10.1038/s42256-022-00536-x.
.