GPT-4 verleiht den Ärzten einen Vorteil im komplexen Fallmanagement

Untersuchungen ergeben, dass Ärzte, die GPT-4 verwenden, bessere Managemententscheidungen treffen, mehr Zeit für Fälle verbringen und nur die Leistung der Ai-Leistungen erbringen-die Zukunft der Unterstützung für die medizinische Entscheidungsunterstützung durchführen.
KI-Tools für künstliche Intelligenz (KI) werden in der aktuellen Forschung ausführlich untersucht, um die medizinische Diagnose und Entscheidungsfindung zu verbessern. Eine kürzlich im Journal veröffentlichte Studie Naturmedizinuntersuchte, ob das Generative Pre-aus-Transformator 4 (GPT-4) des großartigen Modells (LLM) die Leistung der Ärzte bei der Begründung von Ärzten in komplexen klinischen Szenarien verbessern kann.
KI in der Klinik
Ai-A-Augment-Reflexion: Ärzte, die GPT-4 verwenden, zeigten mehr patientenzentrierte Argumentation, wobei einige Antworten mehr Empathie und Berücksichtigung von breiteren Patientenkontexten zeigten.
Die klinische Entscheidungsfindung umfasst zwei Schlüsselkomponenten-Diagnostik- und Management-Argumentation. Während diagnostisches Denken von KI -Tools profitiert, die Differentialdiagnosen generieren, bleibt das Management -Denken eine komplexere Herausforderung. Die Ärzte müssen mehrere Faktoren wies, wie z. B. Patientenpräferenzen, Risiken, Kosten und Behandlungsoptionen, häufig ohne einzelne korrekte Antwort.
Traditionelle KI -Systeme haben zweite Meinungen geliefert, aber bei Managemententscheidungen nicht konsequent einen Vorteil gezeigt. In dieser Hinsicht können LLMs wie GPT-4 mit ihrer Fähigkeit, große Mengen an medizinischem Wissen zu verarbeiten, dazu beitragen, diese Lücke zu schließen, indem sie als kognitive Partner fungieren. Ihre Auswirkungen auf die klinische Entscheidungsfindung in der realen Welt sind jedoch in Bezug auf die reale Umsetzung unsicher, obwohl diese Studie einen klaren Leistungsvorteil zeigte. Frühere Studien haben gezeigt, dass KI die diagnostische Genauigkeit unterstützen kann, aber ihre Rolle bei nuancierten Entscheidungsprozessen wie Behandlungsplanung und Patientenmanagement ist unterbelastet.
Über die Studie
Um den Nutzen von KI-Tools bei der klinischen Entscheidungsfindung zu verstehen, untersuchte die vorliegende Studie, ob Ärzte, die von GPT-4 unterstützt wurden, diejenigen, die konventionelle Ressourcen verwenden, übertrifft. Das Team führte zwischen November 2023 und April 2024 eine randomisierte kontrollierte Studie durch, in der 92 Ärzte geübt wurden.
Zeitverbrauch gegen Leistung: Während die AI-unterstützten Ärzte durchschnittlich 119,3 Sekunden lang pro Fall dauerten, ergab eine tiefere Analyse, dass die Zeit, die die Zeit verbracht hat, positiv mit besseren Entscheidungsfindung korrelierte, selbst nachdem die Reaktionslänge angepasst wurde.
Die Teilnehmer wurden nach dem Zufallsprinzip zwei Gruppen zugeordnet-einer, die GPT-4 für die Unterstützung bei den Managemententscheidungen sowie konventionelle medizinische Ressourcen und die andere verwendeten, die sich ausschließlich auf herkömmliche Ressourcen stützten. Darüber hinaus wurde eine Ai-Only-Gruppe einbezogen, in der GPT-4 die Fälle ohne Beteiligung von Arzt unabhängig beantwortete und einen direkten Vergleich zwischen AI-assistierten Ärzten und solchen, die konventionelle Ressourcen verwenden, einen direkten Vergleich ermöglichte. Jeder Arzt wurde beauftragt, fünf Fallstudien zu lösen, die von Experten auf der Grundlage realer, aber nicht identifizierter Patientenbegegnung erstellt wurden.
Um reale klinische Erkrankungen zu replizieren, wurden Falldetails nacheinander aufgedeckt, wodurch die Ärzte ihre Managementpläne dynamisch anpassen mussten. Das Hauptziel der Studie bestand darin, die Differenz der Gesamtwerte zwischen den beiden Gruppen zu bewerten, die anhand von Experten entwickelten Bewertungsrubriken bewertet wurden. Die in der Studie untersuchten sekundären Ergebnisse umfassten domänenspezifische Leistung, Reaktionslänge und Zeit, die pro Fall verbracht wurden.
Um die Zuverlässigkeit zu gewährleisten, bewerteten drei unabhängige Grader die Antworten mit einer Übereinstimmungsrate von 82%. Die Ärzte nahmen remote oder persönlich teil und hatten bis zu einer Stunde Zeit, um so viele Fälle wie möglich abzuschließen. Die Studie sollte bewerten, ob GPT-4 die menschliche Entscheidungsfindung in komplexen klinischen Szenarien verstärken könnte, anstatt Ärzte direkt zu ersetzen.
Ergebnisse und Implikationen
Die Forscher stellten fest, dass Ärzte, die GPT-4 für Unterstützung für Unterstützung verwenden, im Management-Argumentation im Vergleich zu denjenigen, die konventionelle Ressourcen verwenden, erheblich besser abschnitten. Die AI-unterstützte Gruppe erzielte durchschnittlich 6,5 Prozentpunkte höher (95% Konfidenzintervall: 2,7 bis 10,2, p <0,001).
Interessanterweise war die Leistung von GPT-4 allein bei diesen Aufgaben mit der der Ärzte vergleichbar, die das AI-Tool unter Verwendung des KI (35,7%). Obwohl die AI-Gruppe statistisch nicht signifikant ist, trat die AI-Gruppe zu einer besseren Leistung als AI-unterstützte Ärzte (43,7% gegenüber 43,0%).
Die Studie zeigte, dass im Vergleich zu Ärzten, die nur konventionelle Ressourcen verwendeten, GPT-4-Benutzer bei der Entscheidungsfindung des Managements (40,5% gegenüber 33,4%, p = 0,001), diagnostisches Denken (56,8% gegenüber 45,8%, p = 0,009) hervorragend waren. und kontextspezifische Entscheidungen (42,4% gegenüber 34,9%, p = 0,002). Aspekte wie den sachlichen Rückruf und die allgemeinen Wissenswerte zeigten jedoch keine signifikanten Unterschiede zwischen den beiden Gruppen.
Ai-Only-Überraschungen: Die AI-Alone-Gruppe führte vergleichsweise mit AI-unterstützten Ärzten durch und stellte Fragen darüber auf, ob KI bei zukünftigen Anwendungen unabhängig voneinander bei bestimmten klinischen Entscheidungen ohne menschliche Input helfen könnte.
Darüber hinaus wurde festgestellt, dass AI-unterstützte Ärzte mehr Zeit pro Fall verbringen (119,3 Sekunden länger, p = 0,022), was auf eine tiefere Auseinandersetzung mit der Entscheidungsfindung hinweist. Insbesondere nach der Anpassung an die Zeit und die Reaktionslänge der Zeit übertrafen die ärztlichen Ärzte diejenigen, die konventionelle Ressourcen verwendeten, immer noch, was darauf hinweist, dass höhere Werte nicht nur auf längere Antworten zurückzuführen waren. Darüber hinaus ergab eine Analyse potenzieller Schäden im Vergleich zur Kontrollgruppe keinen signifikanten Anstieg der schädlichen Entscheidungen bei AI-unterstützten Ärzten.
Insbesondere waren AI-unterstützte Ärzte eine geringere Wahrscheinlichkeit, schädliche Entscheidungen mit mittlerem Risiko zu treffen, im Vergleich zu denjenigen, die konventionelle Ressourcen verwenden (8,5% gegenüber 11,4%) und ähnliche Raten von Schaden mit hohem Risiko (4,2% gegenüber 2,9%). Der Schweregrad des Schadens war auch zwischen den Gruppen vergleichbar, wobei bei 4,0% der AI-unterstützten Reaktionen im Vergleich zu 5,3% in der konventionellen Gruppe einen leichten bis mittelschweren Schaden beobachtet wurde. Die schwerwiegenden Schadensraten waren nahezu identisch (7,7% gegenüber 7,5%).
Diese Ergebnisse zeigten, dass die Einbeziehung von GPT-4 in klinische Entscheidungen den Prozess durch Förderung der Reflexion und die Bereitstellung alternativer Perspektiven verbessern könnte. Das Team ist jedoch der Ansicht, dass weitere Studien in realen Umgebungen erforderlich sind, um diese Ergebnisse zu validieren und potenzielle Risiken, einschließlich Halluzinationen und Fehlinformationen, vor der weit verbreiteten klinischen Umsetzung zu untersuchen.
Schlussfolgerungen
Zusammenfassend zeigte diese Studie, dass die Verwendung von LLMs wie GPT-4 in der klinischen Praxis in komplexen klinischen Fällen die Entscheidungsfindung der Ärzte erheblich verbessern kann. Ärzte, die die AI -Unterstützung verwendeten, übertrafen diejenigen, die herkömmliche Ressourcen verwendeten, erheblich übertroffen, was das Potenzial der KI als wertvolles klinisches Instrument deutlich hervorhebt.
Während die Verwendung von KI die Begründung des Managements erhöht, erhöhte sie auch die Zeit pro Fall, was auf einen Kompromiss zwischen Gründlichkeit und Effizienz hinweist. Nach Anpassung an Zeit- und Reaktionslänge machten sich die Ärzte nach der Anpassung immer noch besser und unterstrichen den unabhängigen Nutzen von GPT-4 im klinischen Denken.
Weitere Untersuchungen könnten dazu beitragen, die Auswirkungen solcher LLM-Tools auf die praktische Patientenversorgung zu bestimmen und ihre Integration in die klinische Praxis zu optimieren, um sicherzustellen, dass potenzielle Risiken wie Halluzinationen und kognitive Überlastung sorgfältig verwaltet werden.
Quellen:
- Goh, E., Gallo, R. J., Strong, E., Weng, Y., Kerman, H., Freed, J. A., Cool, J. A., Kanjee, Z., Lane, K. P., Parsons, A. S., Ahuja, N., Horvitz, E., Yang, D., Milstein, A., Olson, A. P., Hom, J., Chen, J. H., & Rodman, A. (2025). GPT-4 assistance for improvement of physician performance on patient care tasks: A randomized controlled trial. Nature Medicine, 1-6. DOI:10.1038/s41591-024-03456-y, https://www.nature.com/articles/s41591-024-03456-y