AI meditsiinis: revolutsioonilised tööriistad, ebakindlad tulemused
Kas tehisintellekt võib tõesti muuta tervishoiu revolutsiooniliseks? Süstemaatiline ülevaade paljastab varjatud lüngad patsientide kasust ja tõkked sisukale kliinilisele integratsioonile. Hiljutises ajakirjas The Lancet Regional Health - Europe avaldatud uuringus hindas rühm teadlasi tervishoiutöötajate kasutatavate tehisintellektil (AI) põhinevate algoritmiliste otsustussüsteemide (ADM) eeliseid ja kahjusid võrreldes tavahooldusega, keskendudes patsiendi jaoks olulistele tulemustele. Taust AI edusammud on võimaldanud süsteemidel ületada meditsiinieksperte sellistes ülesannetes nagu diagnoosimine, isikupärastatud meditsiin, patsientide jälgimine ja ravimite arendamine. Vaatamata nendele edusammudele jääb ebaselgeks, kas paranenud...
AI meditsiinis: revolutsioonilised tööriistad, ebakindlad tulemused
Kas tehisintellekt võib tõesti muuta tervishoiu revolutsiooniliseks? Süstemaatiline ülevaade paljastab varjatud lüngad patsientide kasust ja tõkked sisukale kliinilisele integratsioonile.
aastal avaldatud hiljutises uuringusLanceti piirkondlik tervis – Euroopa, hindas rühm teadlasi tervishoiutöötajate kasutatavate tehisintellektil (AI) põhinevate algoritmiliste otsustussüsteemide (ADM) eeliseid ja kahjusid võrreldes tavahooldusega, keskendudes patsiendi jaoks olulistele tulemustele.
taustal
AI edusammud on võimaldanud süsteemidel ületada meditsiinieksperte sellistes ülesannetes nagu diagnoosimine, isikupärastatud meditsiin, patsientide jälgimine ja ravimite arendamine. Vaatamata nendele edusammudele jääb ebaselgeks, kas paranenud diagnostiline täpsus ja tulemuslikkuse mõõdikud toovad kaasa patsiendi käegakatsutava kasu, nagu suremuse või haigestumuse vähenemine.
Praegused uuringud eelistavad sageli analüütilist jõudlust kliinilistele tulemustele ja paljud tehisintellektil põhinevad meditsiiniseadmed kiidetakse heaks ilma randomiseeritud kontrollitud uuringute (RCT) tõenditeta.
Lisaks tekitab nende tehnoloogiatega seotud kahjude läbipaistvuse ja standardiseeritud hinnangute puudumine eetilisi ja praktilisi probleeme. See toob esile kriitilise lünka tehisintellekti uurimis- ja arendustegevuses, mis nõuab täiendavaid hindamisi, mis keskenduvad patsiendi jaoks olulistele tulemustele, et tagada sisukas ja ohutu integreerimine tervishoiuga.
Uuringu kohta
Piiratud väline valideerimine: enamik hinnatud tehisintellekti süsteeme töötati välja sisemiste andmete põhjal, vähesed uuringud teatasid välisest valideerimisest, tekitades muret nende üldistavuse pärast erinevatele patsientide populatsioonidele.
See süstemaatiline ülevaade järgis metodoloogilise ranguse tagamiseks eelistatud aruandlusüksusi süstemaatiliseks ülevaateks ja metaanalüüsiks (PRISMA). Otsingud viidi läbi meditsiinilise kirjanduse analüüsi- ja otsingusüsteemis Online (MEDLINE), Excerpta Medica andmebaasis (EMBASE), avalikus/väljaandvas MEDLINE'is (PubMed) ning elektri- ja elektroonikainseneride instituudis (IEEE) Xplore'is ning need hõlmasid 10-aastast perioodi kuni 27. Otsing hõlmas AI, masinõppe (ML), otsustusalgoritmide, tervishoiutöötajate ja patsientide tulemustega seotud termineid.
Abikõlblikud uuringud hõlmasid sekkumis- või vaatluskavandeid tehisintellekti otsustamise tugisüsteemidega, mis on välja töötatud ML-ga või seda võimendades. Uuringud pidid teatama patsiendiga seotud tulemustest, nagu suremus, haigestumus, haiglas viibimise kestus, tagasivõtmine või tervisega seotud elukvaliteet. Välistamiskriteeriumid hõlmasid uuringuid ilma eelregistreerimiseta, ilma hoolduskontrolli standardita või keskendudes robootikale või muudele tehisintellektil põhinevate otsuste tegemisega mitteseotud süsteemidele. Selle ülevaatuse protokoll eelregistreeriti rahvusvahelises süstemaatiliste ülevaadete tulevases registris (PROSPERO) ja kõik muudatused dokumenteeriti.
Arvustajad kontrollisid pealkirju, kokkuvõtteid ja täistekste etteantud kriteeriumide alusel. Andmete kogumine ja kvaliteedi hindamine viidi läbi iseseisvalt, kasutades standardseid vorme. Kallutatuse riski hinnati tööriista Cochrane Risk of Bias 2 (RoB 2) ja mitte-juhuslike sekkumiste uuringute (ROBINS-I) tööriista abil, et võtta arvesse võimalikke segavaid tegureid, samas kui aruandluse läbipaistvust hinnati, kasutades aruandluskatsete läbipaistvat aruannet Consolidated Standards Expansion of Reporting Trials (Aruandluskatsete laiendamine) ja CONSORT a. individuaalse prognoosi või diagnoosi ennustusmudel - tehisintellekti (TRIPOD-AI) raamistik.
Eraldatud andmed hõlmasid uuringu sätteid, ülesehitust, sekkumise ja võrdluse üksikasju, patsiendi ja professionaalse demograafiat, algoritmi omadusi ja tulemusnäitajaid. Uuringud liigitati ka tehisintellekti süsteemi tüübi, kliinilise valdkonna, prognoosieesmärkide ning regulatiivse ja rahastamisteabe järgi. Analüüsis uuriti ka seda, kas tehisintellektisüsteemide ainulaadne panus tulemustesse on eraldatud ja kinnitatud.
Uuringu tulemused
Alaesindatud erialad: kuigi psühhiaatria ja onkoloogia uuringud olid hästi esindatud, on teised erialad, nagu intensiivravi ja pulmonoloogia, endiselt alaesindatud, mis võib moonutada tulemuste laiemat rakendatavust.
Süstemaatiline ülevaade hõlmas 19 uuringut, sealhulgas 18 RCT-d ja ühte prospektiivset kohortuuringut, mis valiti välja pärast 3000 kirje läbivaatamist. Need uuringud viidi läbi erinevates piirkondades, sealhulgas üheksa USA-s, neli Euroopas, kolm Hiinas ja teised, mida levitati kogu maailmas. Seaded hõlmasid 14 uuringut haiglas, kolm ambulatoorses kliinikus, üks hooldekodus ja üks segakeskkonnas.
Õpingud hõlmasid erinevaid meditsiinierialasid, sealhulgas onkoloogiat (4 uuringut), psühhiaatriat (3 uuringut), sisehaigla meditsiini, neuroloogiat ja anestesioloogiat (igaüks 2 uuringut), aga ka diabetoloogia, pulmonoloogia, intensiivravi ja teiste erialade individuaalõpinguid.
Kõigi uuringute keskmine osalejate arv oli 243 ja keskmine vanus 59,3 aastat. Naiste osakaal oli keskmiselt 50,5% ja 10 uuringut teatasid rassist või etnilisest koosseisust, keskmiselt 71,4% valgenahalistest. Kaheteistkümnes uuringus kirjeldati kavandatavaid tervishoiutöötajaid, näiteks õdesid või esmatasandi arstiabi osutajaid, ja üheksat üksikasjalikku koolitusprotokolli, mis ulatusid platvormi lühikestest tutvustustest kuni mitmepäevaste juhendatud seanssideni.
AI-süsteemid erinevad tüübi ja funktsiooni poolest. Seitsmes uuringus kasutati seiresüsteeme reaalajas jälgimiseks ja ennustavate hoiatuste jaoks, kuues kasutati ravi isikupärastamise süsteemi ja neljas uuringus integreeriti mitu funktsiooni. Näited hõlmasid diabeedi glükeemilise kontrolli algoritme, personaalset psühhiaatrilist abi ja venoosse trombemboolia jälgimist. Arendusandmete allikad ulatusid suurtest sisemistest andmekogumitest kuni koondatud mitme institutsiooniliste andmeteni, rakendades erinevaid ML-mudeleid, nagu gradiendi võimendamine, närvivõrgud, Bayesi klassifikaatorid ja regressioonipõhised mudelid. Nendest arengutest hoolimata oli algoritmide väline valideerimine enamikus uuringutes piiratud, tekitades muret nende üldistavuse pärast laiematele patsientide populatsioonidele.
Kallutatuse riski hinnati neljas RCT-s madalaks, seitsmes mõõdukaks ja veel seitsmes kõrgeks, samas kui kohortuuringus oli tõsine eelarvamuste oht. CONSORT-AI ja TRIPOD-AI juhiste järgimine varieerus – kolm uuringut saavutasid täieliku vastavuse, samas kui teistes oli vastavus kõrge kuni madal. Enamik uuringuid, mis viidi läbi enne nende juhiste kasutuselevõttu, näitasid mõõdukat järgimist, kuigi selgesõnalisi viiteid juhistele oli harva.
Tulemused näitasid kasu ja kahju segu. Kaksteist uuringut teatasid patsiendile olulistest eelistest, sealhulgas suremuse vähenemisest, depressiooni ja valu paranemisest ning elukvaliteedi paranemisest. Kuid ainult kaheksa uuringut sisaldasid standardiseeritud kahjuhinnanguid ja enamik neist ei suutnud kõrvaltoimeid põhjalikult dokumenteerida. Kuigi kuus AI-süsteemi said regulatiivse heakskiidu, jäid seosed regulatiivse staatuse, uuringu kvaliteedi ja patsientide tulemuste vahel ebaselgeks.
Järeldused
See süstemaatiline ülevaade toob esile kvaliteetsete uuringute puudumise, mis hindaksid AI-ga seotud ADM-süsteemide patsientide jaoks olulisi tulemusi tervishoius. Kuigi psühhiaatrias näidati järjekindlalt kasu, teatati teistest valdkondadest vastuolulistest tulemustest, piiratud tõenditega suremuse, ärevuse ja haiglaravi paranemise kohta. Enamikus uuringutes puudusid tasakaalustatud kahju-kasuhinnangud ja need ei suutnud eraldada tehisintellekti ainulaadset panust.
Leiud rõhutavad tungivat vajadust läbipaistva aruandluse, kindlate valideerimistavade ja standardiseeritud raamistike järele, et juhtida tehisintellekti ohutut ja tõhusat integreerimist kliinilisse keskkonda.
Allikad: