Hybrid -Lesestrategie zum Screening -Mammographie reduziert die Arbeitsbelastung der Radiologen

Eine hybride Lesenstrategie für das Screening -Mammographie, die von niederländischen Forschern entwickelt und retrospektiv zu mehr als 40.000 Prüfungen eingesetzt wurde, verringerte die Arbeitsbelastung der Radiologen um 38%, ohne die Rückruf- oder Krebserkennungsraten zu ändern. Die Studie, die das Vertrauen von KI betont, wurde heute in veröffentlicht Radiologieein Journal der Radiological Society of North America (RSNA).
„Obwohl die Gesamtleistung hochmoderner KI-Modelle sehr hoch ist, macht KI manchmal Fehler“, sagte Sarah D. Verboom, M.Sc., Doktorandin der Abteilung für medizinische Bildgebung des Radboud University Medical Center in den Niederlanden. „Die Identifizierung von Prüfungen, bei denen die AI -Interpretation unzuverlässig ist, ist entscheidend, um die Verwendung von AI -Modellen in Brustkrebs -Screening -Programmen zu ermöglichen und zu optimieren.“
Die hybride Lesestrategie umfasst die Verwendung einer Kombination aus Radiologen-Lesern und einer eigenständigen AI-Interpretation von Fällen, in denen das KI-Modell ebenso wie der Radiologe ausgeführt wird.
„Wir können dieses Leistungsniveau erreichen, wenn das KI -Modell nicht nur eine Bewertung der Wahrscheinlichkeit von Malignität (POM) für einen Fall liefert, sondern auch eine Bewertung ihrer Sicherheit dieser Bewertung“, sagte Verboom. „Leider ist der Pom selbst nicht immer ein guter Prädiktor für die Gewissheit, da tiefe neuronale Netzwerke in ihren Vorhersagen zu übermütig sind.“
Um eine hybride Lesestrategie zu entwickeln und zu bewerten, verwendeten die Forscher einen Datensatz mit 41.469-Screening-Mammographieprüfungen von 15.522 Frauen (Durchschnittsalter 59 Jahre) mit 332 Screenscortected-Krebs und 34 Intervallkrebs. Die Prüfungen wurden zwischen 2003 und 2018 in Utrecht, Niederlande, im Rahmen des niederländischen nationalen Brustkrebs -Screening -Programms durchgeführt.
Der Datensatz wurde auf Patientenebene in zwei gleiche Gruppen unterteilt, wobei die Erkennung, Rückruf- und Intervallkrebsraten identische Krebsrate. Die erste Gruppe wurde verwendet, um die optimalen Schwellenwerte für die Hybrid -Lesestrategie zu bestimmen, während die zweite Gruppe zur Bewertung der Lesestrategien verwendet wurde.
Von den von den Forschern bewerteten Unsicherheitsmetriken führte die Entropie des mittleren POM-Scores der verdächtigen Region zu einer Krebserkennungsrate von 6,6 pro 1.000 Fällen und einer Rückrufrate von 23,7 pro 1.000 Fälle, ähnlich wie die Raten des Standard-Doppellesequotens durch Radiologen.
Die endgültige Hybrid -Lesestrategie umfasste AI, die jedes Screening -Mammogramm bewertete, um zwei Ausgänge zu erzeugen: die POM und eine Unsicherheitsschätzung dieser Vorhersage. Als AI feststellte, dass der POM mit Sicherheit unter dem festgelegten Schwellenwert lag, wurde der Fall als normal angesehen. Als KI einen Pom über der festgelegten Schwelle feststellte, wurden Frauen für weitere Tests zurückgerufen, aber nur dann, wenn diese Vorhersage als selbstbewusst eingestuft wurde. Andernfalls wurde die Prüfung von Radiologen doppelt gelesen.
Obwohl die Mehrheit der KI -Entscheidungen ungewiss war und an einen menschlichen Leser verschoben wurde, wurden 38% als sicher eingestuft und konnten ausschließlich von KI gelesen werden. Unter Verwendung der Forscherstrategie reduzierte die Radiologe die Arbeitsbelastung auf 61,9%, ohne den Rückruf (23,6 ‰ vs 23,9 ‰) oder die Erkennung von Krebs (6,6 ‰ gegenüber 6,7 ‰) zu ändern, die beide mit denen des Standard-Doppel-Lesens vergleichbar sind.
Wenn das KI -Modell sicher war, war die Fläche unter der Kurve (AUC) höher (0,96 gegenüber 0,87). Die Empfindlichkeit entsprach fast der des Doppelradiologen -Lesens (85,4% gegenüber 88,9%). Jüngere Frauen mit dichten Brüsten hatten häufiger einen unsicheren KI -Score.
„Die Schlüsselkomponente unserer Studie ist nicht unbedingt, dass dies der beste Weg ist, um die Arbeitsbelastung aufzuteilen, aber es ist hilfreich, eine in KI -Modellen eingebaute Unsicherheitsquantifizierung zu haben“, sagte Verboom. „Ich hoffe, dass kommerzielle Produkte dies in ihre Modelle integrieren, weil ich denke, dass es eine sehr nützliche Metrik ist.“
Verboom stellte fest, dass die Entscheidung, 19% der Frauen in der klinischen Praxis in der klinischen Praxis zu ermitteln, von AI ohne die Intervention eines Radiologen getroffen würden.
„Mehrere Studien haben gezeigt, dass Frauen, die an Brustkrebs -Screening -Programmen teilnehmen, positive Einstellungen zum Einsatz von KI haben“, sagte sie. „Die meisten Frauen bevorzugen jedoch, dass ihre Mammographie von mindestens einem Radiologen gelesen wird.“
Sie sagte, es könnte für Radiologen akzeptabler sein, Prüfungen zu überprüfen, die von AI und AI -Rückruffällen als unsicher angesehen werden.
„Die Verwendung von KI mit Unsicherheitsquantifizierung kann eine mögliche Lösung für Belegschaftsmangel sein und dazu beitragen, das Vertrauen in die Umsetzung von KI aufzubauen“, sagte Verboom.
Laut Verboom sei weiterer Forschungsarbeiten, idealerweise eine prospektive Studie, erforderlich, um festzustellen, wie die durch die Hybrid -Lesestrategie erzielte Arbeitsbelastungsstrategie die Lesezeit des Radiologen verringern könnte.
„Ich denke, in Zukunft könnten wir einen Punkt erreichen, an dem ein Teil der Frauen nach Hause geschickt wird, ohne jemals einen Radiologen ihre Mammographie zu betrachten, weil die KI feststellen wird, dass ihre Prüfung normal ist“, sagte sie. „Wir sind noch nicht da, aber ich denke, wir könnten mit dieser Unsicherheitsmetrik und der Qualitätskontrolle dorthin gelangen.“
Diese Studie ist Teil des Airead -Projekts, das vom niederländischen Forschungsrat, der niederländischen Krebsgesellschaft und dem Gesundheitswesen Holland finanziert wird.
Quellen:
Verboom, S. D., et al. (2025) AI Should Read Mammograms Only When Confident: A Hybrid Breast Cancer Screening Reading Strategy. Radiology. doi.org/10.1148/radiol.242594.