AI в медицината: революционни инструменти, несигурни резултати

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Може ли AI наистина да революционизира здравеопазването? Систематичният преглед разкрива скритите пропуски в ползата за пациентите и бариерите пред смислена клинична интеграция. В скорошно проучване, публикувано в The Lancet Regional Health - Europe, група изследователи оценяват ползите и вредите от базираните на изкуствен интелект (AI) алгоритмични системи за вземане на решения (ADM), използвани от здравните специалисти, в сравнение със стандартните грижи, като се фокусират върху резултатите, свързани с пациента. Предистория Напредъкът в AI позволи на системите да превъзхождат медицинските експерти в задачи като диагностика, персонализирана медицина, наблюдение на пациенти и разработване на лекарства. Въпреки този напредък, остава неясно дали подобрените...

AI в медицината: революционни инструменти, несигурни резултати

Може ли AI наистина да революционизира здравеопазването? Систематичният преглед разкрива скритите пропуски в ползата за пациентите и бариерите пред смислена клинична интеграция.

В скорошно проучване, публикувано вThe Lancet Regional Health – Европа, група изследователи оцениха ползите и вредите от базираните на изкуствен интелект (AI) алгоритмични системи за вземане на решения (ADM), използвани от здравните специалисти, в сравнение със стандартните грижи, като се фокусираха върху резултатите, свързани с пациента.

фон

Напредъкът в AI позволи на системите да надминат медицинските експерти в задачи като диагностика, персонализирана медицина, наблюдение на пациенти и разработване на лекарства. Въпреки този напредък, остава неясно дали подобрената диагностична точност и показатели за ефективност се превръщат в осезаеми ползи за пациентите, като намалена смъртност или заболеваемост.

Настоящите изследвания често дават приоритет на аналитичните резултати пред клиничните резултати и много базирани на изкуствен интелект медицински устройства са одобрени без подкрепящи доказателства от рандомизирани контролирани проучвания (RCT).

Освен това липсата на прозрачност и стандартизирани оценки на вредите, свързани с тези технологии, пораждат етични и практически опасения. Това подчертава критична празнина в изследванията и развитието на ИИ, която изисква по-нататъшни оценки, фокусирани върху релевантните за пациента резултати, за да се гарантира смислена и безопасна интеграция в здравеопазването.

Относно изследването

Ограничено външно валидиране: Повечето оценени AI системи са разработени въз основа на вътрешни данни, като малко проучвания съобщават за външно валидиране, което поражда опасения относно възможността им за обобщаване към различни популации пациенти.

Този систематичен преглед следваше указанията за Предпочитани отчетни елементи за систематични прегледи и мета-анализи (PRISMA), за да се гарантира методологична строгост. Търсенията бяха извършени в системата за анализ и извличане на медицинска литература онлайн (MEDLINE), в базата данни Excerpta Medica (EMBASE), в публичния/издател MEDLINE (PubMed) и в Института на инженерите по електротехника и електроника (IEEE) Xplore и обхващаха период от 10 години до 27 март 2024 г., когато свързаните с AI ADM системи станаха уместни в здравните изследвания. Търсенето включва термини, свързани с AI, машинно обучение (ML), алгоритми за вземане на решения, здравни специалисти и резултати от пациенти.

Допустимите проучвания включват интервенционни или наблюдателни проекти със системи за подпомагане на вземането на решения с изкуствен интелект, разработени с или използващи ML. Проучванията трябваше да отчитат резултати, свързани с пациента, като смъртност, заболеваемост, продължителност на болничния престой, повторно приемане или свързано със здравето качество на живот. Критериите за изключване включват проучвания без предварителна регистрация, без стандарт за контрол на грижите или с фокус върху роботиката или други системи, които не са свързани с вземането на решения, базирано на AI. Протоколът за този преглед беше предварително регистриран в Международния проспективен регистър на систематичните прегледи (PROSPERO) и всички промени бяха документирани.

Рецензентите проверяваха заглавия, резюмета и пълни текстове въз основа на предварително зададени критерии. Извличането на данни и оценката на качеството бяха извършени независимо с помощта на стандартизирани формуляри. Рискът от пристрастия беше оценен с помощта на инструмента Cochrane Risk of Bias 2 (RoB 2) и инструмента Risk of Bias in Non-Randomized Studies of Interventions (ROBINS-I), за да се отчетат потенциалните объркващи фактори, докато прозрачността на докладването беше оценена с помощта на Консолидираните стандарти за разширяване на отчетните проучвания - изкуствен интелект (CONSORT-AI) и прозрачното докладване на многовариантен прогнозен модел за индивидуална прогноза или диагноза - рамка за изкуствен интелект (TRIPOD-AI).

Извлечените данни включват настройки на проучването, дизайн, интервенция и подробности за сравнение, демография на пациенти и професионалисти, характеристики на алгоритъма и мерки за резултатите. Проучванията също бяха класифицирани по тип на AI система, клинична област, цели за прогнозиране и регулаторна информация и информация за финансиране. Анализът също така изследва дали уникалните приноси на AI системите към резултатите са изолирани и валидирани.

Резултати от изследването

Недостатъчно представени специалности: Докато изследванията по психиатрия и онкология бяха добре представени, други специалности като интензивни грижи и пулмология остават недостатъчно представени, което потенциално изкривява по-широката приложимост на резултатите.

Систематичният преглед включва 19 проучвания, включително 18 RCT и едно проспективно кохортно проучване, избрани след преглед на 3000 записа. Тези проучвания са проведени в различни региони, включително девет в Съединените щати, четири в Европа, три в Китай и други, разпространени по целия свят. Условията включват 14 проучвания в болница, три в извънболнични клиники, едно в старчески дом и едно в смесена среда.

Проучванията обхващат редица медицински специалности, включително онкология (4 проучвания), психиатрия (3 проучвания), вътрешни болнични болести, неврология и анестезиология (по 2 проучвания), както и отделни проучвания по диабетология, пулмология, интензивно лечение и други специалности.

Средният брой участници във всички проучвания е 243, със средна възраст 59,3 години. Делът на жените е средно 50,5%, а 10 проучвания съобщават за расов или етнически състав, като средната стойност е 71,4% бели участници. Дванадесет проучвания описват предвидените здравни специалисти, като например: медицински сестри или доставчици на първична медицинска помощ, и девет подробни протокола за обучение, вариращи от кратки въведения в платформата до многодневни сесии под наблюдение.

AI системите се различават по вид и функция. Седем проучвания са използвали системи за мониторинг за наблюдение в реално време и прогнозни сигнали, шест са използвали системи за персонализиране на лечението и четири проучвания са интегрирали множество функции. Примерите включват алгоритми за гликемичен контрол при диабет, персонализирани психиатрични грижи и мониториране на венозна тромбоемболия. Източниците на данни за разработката варираха от големи вътрешни набори от данни до обединени мултиинституционални данни, прилагащи различни модели на машинно обучение, като градиентно усилване, невронни мрежи, байесови класификатори и базирани на регресия модели. Въпреки тези развития, външното валидиране на алгоритмите беше ограничено в повечето проучвания, което поражда опасения относно тяхната възможност за обобщаване към по-широки групи пациенти.

Рискът от отклонение беше оценен като нисък в четири РКИ, умерен в седем и висок в още седем, докато кохортното проучване имаше сериозен риск от отклонение. Придържането към указанията на CONSORT-AI и TRIPOD-AI варира, като три проучвания постигат пълно съответствие, докато други имат високо до ниско съответствие. Повечето проучвания, проведени преди въвеждането на тези насоки, показват умерено спазване, въпреки че изричните препратки към насоките са редки.

Резултатите показват комбинация от ползи и вреди. Дванадесет проучвания съобщават за ползи, свързани с пациентите, включително намаляване на смъртността, подобрено управление на депресията и болката и подобрено качество на живот. Само осем проучвания обаче включват стандартизирани оценки на вредите и повечето от тях не успяха да документират изчерпателно нежеланите събития. Въпреки че шест системи с ИИ получиха регулаторни одобрения, връзките между регулаторния статус, качеството на изследването и резултатите от пациентите остават неясни.

Изводи

Този систематичен преглед подчертава липсата на висококачествени проучвания, оценяващи релевантните за пациентите резултати от свързаните с AI ADM системи в здравеопазването. Въпреки че ползите са последователно показани в психиатрията, други области съобщават за смесени резултати с ограничени доказателства за подобрения в смъртността, тревожността и хоспитализациите. В повечето проучвания липсваха балансирани оценки на вредите и ползите и не успяха да изолират уникалния принос на ИИ.

Констатациите подчертават спешната необходимост от прозрачно докладване, стабилни практики за валидиране и стандартизирани рамки, които да ръководят безопасното и ефективно интегриране на AI в клинични среди.


източници: