Patologiset tekoälymallit paljastavat demografisia vääristymiä syövän diagnosoinnissa
Patologia on pitkään ollut syövän diagnosoinnin ja hoidon kulmakivi. Patologi tutkii huolellisesti erittäin ohutta osaa ihmiskudosta mikroskoopilla löytääkseen johtolankoja, jotka osoittavat syövän esiintymisen, tyypin ja vaiheen. Ihmisasiantuntijalle pyörteisen vaaleanpunaisen kudosnäytteen katseleminen, jossa on violetteja soluja, on...
Patologiset tekoälymallit paljastavat demografisia vääristymiä syövän diagnosoinnissa
Patologia on pitkään ollut syövän diagnosoinnin ja hoidon kulmakivi. Patologi tutkii huolellisesti erittäin ohutta osaa ihmiskudosta mikroskoopilla löytääkseen johtolankoja, jotka osoittavat syövän esiintymisen, tyypin ja vaiheen.
Ihmisasiantuntijalle pyörteisen vaaleanpunaisen kudosnäytteen katsominen, jossa on purppuraisia soluja, on kuin arvostella tutkimuksia ilman nimeä – dia paljastaa oleellisia tietoja sairaudesta antamatta lisätietoja potilaasta.
Sama ei kuitenkaan välttämättä päde viime vuosina syntyneisiin patologian tekoälyn malleihin. Harvardin lääketieteellisen koulun ryhmän johtama uusi tutkimus osoittaa, että nämä mallit voivat jotenkin päätellä demografisia tietoja patologisista dioista, mikä johtaa syöpädiagnoosien harhaan eri populaatioissa.
Analysoimalla useita merkittäviä patologisia tekoälymalleja syöpädiagnoosissa tutkijat havaitsivat epätasa-arvoisen suorituskyvyn syöpien havaitsemisessa ja erottamisessa eri populaatioissa potilaiden itse ilmoittaman sukupuolen, rodun ja iän perusteella. He tunnistivat useita mahdollisia selityksiä tälle demografiselle harhalle.
Tämän jälkeen tiimi kehitti puitteet nimeltä FAIR-Path, joka auttoi vähentämään mallien harhaa.
Demografisten tietojen lukemista patologiadiasta pidetään ihmispatologille "mahdottomana tehtävänä", joten patologian tekoälyn harha oli meille yllätys.
Kun-Hsing Yu, vanhempi kirjailija, biolääketieteellisen informatiikan apulaisprofessori, HMS:n Blavatnik-instituutti ja HMS:n patologian apulaisprofessori Brigham and Women's Hospitalissa
Tekoälyharhan havaitseminen ja torjuminen lääketieteessä on ratkaisevan tärkeää, koska se voi vaikuttaa diagnostiseen tarkkuuteen sekä potilaiden tuloksiin, Yu sanoi. FAIR-Pathin menestys osoittaa, että tutkijat voivat parantaa syöpäpatologian tekoälymallien ja mahdollisesti muidenkin lääketieteen tekoälymallien oikeudenmukaisuutta vähällä vaivalla.
Osittain liittovaltion rahoituksella tuettu työ on kuvattu 16. joulukuutaSoluraportit Lääketiede.
Tarkista puolueettomuus
Yu ja hänen tiiminsä tutkivat harhaa neljässä syövän arviointiin kehitetyssä AI-patologiamallissa. Näitä syväoppimismalleja koulutettiin annotoiduilla patologisilla dioilla, joista he "oppivat" biologisia malleja, joiden avulla he voivat analysoida uusia dioja ja tehdä diagnooseja.
Tutkijat syöttivät tekoälymalleille suuren, instituutioiden välisen arkiston patologiadiakuvista 20 syöpätyypistä.
He havaitsivat, että kaikilla neljällä mallilla oli vääristynyt suorituskyky ja ne tarjosivat vähemmän tarkkoja diagnooseja tietyissä ryhmissä oleville potilaille oman rodun, sukupuolen ja iän perusteella. Esimerkiksi malleilla oli vaikeuksia erottaa keuhkosyövän alatyyppejä afroamerikkalais- ja miespotilailla ja rintasyövän alatyyppejä nuoremmilla potilailla. Malleilla oli myös vaikeuksia havaita rinta-, munuais-, kilpirauhas- ja mahasyöpiä tietyissä populaatioissa. Näitä suorituskyvyn eroja esiintyi noin 29 prosentissa mallien suorittamista diagnostisista tehtävistä.
Yu sanoi, että tämä diagnostinen epätarkkuus johtuu siitä, että nämä mallit poimivat demografisia tietoja dioista - ja luottavat demografisiin erityisiin malleihin diagnosoinnissa.
Tulokset olivat odottamattomia, "koska odotimme objektiivista patologiaarviointia", Yu lisäsi. "Kuvia arvioiessamme meidän ei välttämättä tarvitse tietää potilaan demografisia tietoja voidaksemme tehdä diagnoosin."
Ryhmä ihmetteli: Miksi patologinen tekoäly ei osoittanut samaa objektiivisuutta?
Selityksiä etsimässä
Tutkijat keksivät kolme selitystä.
Koska tietyissä populaatioissa olevien potilaiden on helpompi saada näytteitä, AI-malleja koulutetaan epäyhtenäisiin näytteisiin. Tämä tekee mallien vaikeammaksi tehdä tarkan diagnoosin näytteistä, jotka eivät ole hyvin edustettuina koulutussarjassa, kuten vähemmistöryhmistä rodun, iän tai sukupuolen perusteella.
Mutta "ongelma oli paljon syvempi", Yu sanoi. Tutkijat huomasivat, että mallit toimivat joskus huonommin väestöryhmässä, vaikka otoskoot olivat vertailukelpoisia.
Lisäanalyysissä havaittiin, että tämä saattaa johtua eroista sairauksien esiintyvyydessä: jotkut syövät ovat yleisempiä tietyissä ryhmissä, mikä tekee malleista parempia diagnoosin tekemisessä näissä ryhmissä. Tämän seurauksena malleilla voi olla vaikeuksia diagnosoida syöpiä populaatioissa, joissa ne eivät ole yhtä yleisiä.
Tekoälymallit tallentavat myös hienovaraisia molekyylieroja näytteissä eri väestöryhmistä. Mallit voivat esimerkiksi havaita mutaatioita syöpää aiheuttavissa geeneissä ja käyttää niitä syövän tyypin välityspalvelimena - ja siksi ne ovat vähemmän tehokkaita diagnoosin tekemisessä populaatioissa, joissa nämä mutaatiot ovat harvinaisempia.
"Huomasimme, että tekoälyn teho antaa sen erottaa monia epäselviä biologisia signaaleja, joita ei voida havaita normaalilla ihmisen tulkinnalla", Yu sanoi.
Tämän ansiosta mallit voivat mahdollisesti oppia signaaleja, jotka liittyvät enemmän väestöön kuin sairauksiin. Tämä puolestaan voi vaikuttaa heidän diagnostisiin kykyihinsä eri ryhmissä.
Yhdessä Yu sanoo, että nämä selitykset viittaavat siihen, että patologisen tekoälyn harha ei johdu vain koulutustietojen vaihtelevasta laadusta, vaan myös tavasta, jolla tutkijat kouluttavat malleja.
Etsi ratkaisu
Arvioituaan harhan laajuuden ja syyt Yu ja hänen tiiminsä ryhtyivät korjaamaan ongelmaa.
Tutkijat kehittivät FAIR-Pathin, yksinkertaisen kehyksen, joka perustuu olemassa olevaan koneoppimiskonseptiin, jota kutsutaan kontrastiiviseksi oppimiseksi. Kontrastiivinen oppiminen lisää tekoälykoulutukseen elementin, joka opettaa mallin korostamaan eroja tärkeiden kategorioiden - tässä tapauksessa syöpien - välillä ja vähättelemään eroja vähemmän tärkeiden kategorioiden - tässä tapauksessa demografisten ryhmien - välillä.
Kun tutkijat käyttivät FAIR-Path-kehystä testaamissaan malleissa, se vähensi diagnostisia eroja noin 88 prosenttia.
"Näytämme, että tämän pienen säädön avulla mallit voivat oppia vankkoja ominaisuuksia, jotka tekevät niistä yleistettäviä ja oikeudenmukaisempia eri väestöryhmissä", Yu sanoi.
Tulos on rohkaiseva, hän lisäsi, koska se viittaa siihen, että harhaa voidaan vähentää jopa ilman, että malleja koulutettaisiin täysin oikeudenmukaisilla, edustavilla tiedoilla.
Seuraavaksi Yu ja hänen tiiminsä tekevät yhteistyötä laitosten kanssa eri puolilla maailmaa tutkiakseen patologisen tekoälyn vinoutumisen laajuutta paikoissa, joilla on erilaiset väestötiedot ja erilaiset kliiniset ja patologiset käytännöt. He tutkivat myös tapoja laajentaa FAIR-Path asetuksiin, joissa näytekoko on rajoitettu. Lisäksi he haluavat tutkia, kuinka tekoälyn harha vaikuttaa väestörakenteen eroihin terveydenhuollon ja potilaiden tuloksista.
Lopulta Yu sanoi, että tavoitteena on luoda oikeudenmukaisia, puolueettomia patologisia tekoälymalleja, jotka voivat parantaa syövän hoitoa auttamalla ihmispatologeja tekemään diagnoosin nopeasti ja tarkasti.
"Mielestäni on toivoa, että jos olemme tietoisempia ja huolellisempia tekoälyjärjestelmien kehittämisessä, voimme kehittää malleja, jotka toimivat hyvin missä tahansa väestössä", hän sanoi.
Lähteet:
Lin, S.-Y.,et ai. (2025). Kontrastiivinen oppiminen lisää oikeudenmukaisuutta patologisissa tekoälyjärjestelmissä. Soluraportit Lääketiede. doi:10.1016/j.xcrm.2025.102527. https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00600-7