AI în medicină: instrumente revoluționare, rezultate incerte
Poate AI să revoluționeze cu adevărat asistența medicală? O revizuire sistematică descoperă lacunele ascunse în beneficiul pacientului și barierele în calea integrării clinice semnificative. Într-un studiu recent publicat în The Lancet Regional Health - Europe, un grup de cercetători a evaluat beneficiile și daunele sistemelor algoritmice de luare a deciziilor (ADM) bazate pe inteligența artificială (AI) utilizate de profesioniștii din domeniul sănătății în comparație cu îngrijirea standard, concentrându-se pe rezultatele relevante pentru pacient. Context Progresele în IA au permis sistemelor să depășească experții medicali în sarcini precum diagnosticare, medicină personalizată, monitorizarea pacienților și dezvoltarea medicamentelor. În ciuda acestor progrese, rămâne neclar dacă s-a îmbunătățit...
AI în medicină: instrumente revoluționare, rezultate incerte
Poate AI să revoluționeze cu adevărat asistența medicală? O revizuire sistematică descoperă lacunele ascunse în beneficiul pacientului și barierele în calea integrării clinice semnificative.
Într-un studiu recent publicat înThe Lancet Regional Health – Europa, un grup de cercetători a evaluat beneficiile și daunele sistemelor algoritmice de luare a deciziilor (ADM) bazate pe inteligența artificială (AI) utilizate de profesioniștii din domeniul sănătății în comparație cu îngrijirea standard, concentrându-se pe rezultatele relevante pentru pacient.
fundal
Progresele în IA au permis sistemelor să depășească experții medicali în sarcini precum diagnosticare, medicină personalizată, monitorizarea pacienților și dezvoltarea medicamentelor. În ciuda acestor progrese, rămâne neclar dacă precizia îmbunătățită a diagnosticului și măsurătorile de performanță se traduc în beneficii tangibile pentru pacient, cum ar fi reducerea mortalității sau morbidității.
Cercetările actuale acordă adesea prioritate performanței analitice față de rezultatele clinice, iar multe dispozitive medicale bazate pe inteligență artificială sunt aprobate fără dovezi susținute din studiile randomizate controlate (RCT).
În plus, lipsa transparenței și a evaluărilor standardizate ale daunelor asociate acestor tehnologii ridică preocupări etice și practice. Acest lucru evidențiază un decalaj critic în cercetarea și dezvoltarea IA, care necesită evaluări suplimentare axate pe rezultate relevante pentru pacient, pentru a asigura o integrare semnificativă și sigură în asistența medicală.
Despre studiu
Validare externă limitată: Majoritatea sistemelor AI evaluate au fost dezvoltate pe baza datelor interne, puține studii care raportează validare externă, ridicând îngrijorări cu privire la generalizarea acestora la diferite populații de pacienți.
Această revizuire sistematică a urmat liniile directoare PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) pentru a asigura rigoarea metodologică. Căutările au fost efectuate în Medical Literature Analysis and Retrieval System Online (MEDLINE), în Excerpta Medica Database (EMBASE), în public/editorul MEDLINE (PubMed) și în Institute of Electrical and Electronics Engineers (IEEE) Xplore și au acoperit o perioadă de 10 ani până la 27 martie 2024 când studiile ADMAI-2024 au devenit relevante în sistemele de sănătate. Căutarea a inclus termeni legați de AI, învățare automată (ML), algoritmi de decizie, profesioniști din domeniul sănătății și rezultatele pacienților.
Studiile eligibile au inclus proiecte de intervenție sau observaționale cu sisteme de sprijinire a deciziilor AI dezvoltate cu sau folosind ML. Studiile au trebuit să raporteze rezultate relevante pentru pacient, cum ar fi mortalitatea, morbiditatea, durata spitalizării, readmisia sau calitatea vieții legate de sănătate. Criteriile de excludere au inclus studii fără preînregistrare, fără un standard de control al îngrijirii sau cu accent pe robotică sau alte sisteme care nu au legătură cu luarea deciziilor bazate pe IA. Protocolul pentru această revizuire a fost preînregistrat în Registrul internațional prospectiv al evaluărilor sistematice (PROSPERO) și toate modificările au fost documentate.
Revizorii au verificat titlurile, rezumatele și textele complete pe baza unor criterii predefinite. Extragerea datelor și evaluarea calității au fost efectuate independent, folosind formulare standardizate. Riscul de părtinire a fost evaluat utilizând instrumentul Cochrane Risk of Bias 2 (RoB 2) și instrumentul Risk of Bias in Non-Randomized Studies of Interventions (ROBINS-I) pentru a ține cont de potențialii factori de confuzie, în timp ce transparența raportării a fost evaluată utilizând Consolidated Standards Expansion of Reporting Trials-AI (Raportul de raportare Artificial-AI) și transparent (ORT) model de predicție multivariabil pentru prognostic sau diagnostic individual - cadrul de inteligență artificială (TRIPOD-AI).
Datele extrase au inclus setările studiului, designul, detaliile de intervenție și comparație, datele demografice ale pacienților și profesioniștilor, caracteristicile algoritmului și măsurile de rezultat. Studiile au fost, de asemenea, clasificate după tipul de sistem AI, zona clinică, obiectivele de predicție și informațiile de reglementare și finanțare. Analiza a examinat, de asemenea, dacă contribuțiile unice ale sistemelor AI la rezultate au fost izolate și validate.
Rezultatele studiului
Specialități subreprezentate: în timp ce studiile de psihiatrie și oncologie au fost bine reprezentate, alte specialități, cum ar fi îngrijirea critică și pneumologia, rămân subreprezentate, potențial distorsionând aplicabilitatea mai largă a rezultatelor.
Revizuirea sistematică a inclus 19 studii, inclusiv 18 RCT și un studiu prospectiv de cohortă, selectate după revizuirea a 3.000 de înregistrări. Aceste studii au fost efectuate în diferite regiuni, inclusiv nouă în Statele Unite, patru în Europa, trei în China și altele distribuite în întreaga lume. Setările au inclus 14 studii în spital, trei în ambulatorii, unul într-un azil de bătrâni și unul într-un mediu mixt.
Studiile au acoperit o gamă largă de specialități medicale, inclusiv oncologie (4 studii), psihiatrie (3 studii), medicină interna spitalicească, neurologie și anestezie (2 studii fiecare), precum și studii individuale în diabetologie, pneumologie, terapie intensivă și alte specialități.
Numărul mediu de participanți la toate studiile a fost de 243, cu o vârstă medie de 59,3 ani. Proporția femeilor a fost în medie de 50,5%, iar 10 studii au raportat compoziția rasială sau etnică, cu o medie de 71,4% participanți albi. Douăsprezece studii au descris profesioniștii din domeniul sănătății vizați, cum ar fi: de exemplu, asistente medicale sau furnizori de asistență medicală primară și nouă protocoale de instruire detaliate, de la scurte introduceri la platformă până la sesiuni supravegheate de mai multe zile.
Sistemele AI diferă ca tip și funcție. Șapte studii au folosit sisteme de monitorizare pentru monitorizare în timp real și alerte predictive, șase au folosit sisteme de personalizare a tratamentului și patru studii au integrat funcții multiple. Exemplele includ algoritmi pentru controlul glicemic în diabet, îngrijire psihiatrică personalizată și monitorizarea tromboembolismului venos. Sursele de date de dezvoltare au variat de la seturi interne mari de date la date multi-instituționale grupate, aplicând diverse modele ML, cum ar fi creșterea gradientului, rețelele neuronale, clasificatorii bayesieni și modelele bazate pe regresie. În ciuda acestor evoluții, validarea externă a algoritmilor a fost limitată în majoritatea studiilor, ridicând îngrijorări cu privire la generalizarea lor la populațiile mai largi de pacienți.
Riscul de părtinire a fost evaluat ca scăzut în patru RCT, moderat în șapte și ridicat în alte șapte, în timp ce studiul de cohortă a avut un risc serios de părtinire. Aderarea la liniile directoare CONSORT-AI și TRIPOD-AI a variat, trei studii obținând conformitatea deplină, în timp ce altele au avut o conformitate ridicată spre scăzută. Majoritatea studiilor efectuate înainte de introducerea acestor ghiduri au arătat o aderență moderată, deși referirile explicite la ghiduri au fost rare.
Rezultatele au arătat o combinație de beneficii și daune. Douăsprezece studii au raportat beneficii relevante pentru pacient, inclusiv reduceri ale mortalității, îmbunătățirea managementului depresiei și durerii și îmbunătățirea calității vieții. Cu toate acestea, doar opt studii au inclus evaluări standardizate ale efectelor nocive și cele mai multe dintre ele nu au reușit să documenteze în mod cuprinzător evenimentele adverse. Deși șase sisteme AI au primit aprobări de reglementare, relațiile dintre statutul de reglementare, calitatea studiului și rezultatele pacienților au rămas neclare.
Concluzii
Această revizuire sistematică evidențiază lipsa unor studii de înaltă calitate care să evalueze rezultatele relevante pentru pacient ale sistemelor ADM legate de IA în asistența medicală. În timp ce beneficiile au fost demonstrate în mod constant în psihiatrie, alte domenii au raportat rezultate mixte, cu dovezi limitate de îmbunătățire a mortalității, anxietății și spitalizărilor. Majoritatea studiilor nu au avut evaluări echilibrate daune-beneficii și nu au reușit să izoleze contribuțiile unice ale IA.
Concluziile evidențiază nevoia urgentă de raportare transparentă, practici de validare robuste și cadre standardizate pentru a ghida integrarea sigură și eficientă a IA în mediile clinice.
Surse: