Laut einer am 21. Januar 2026 im Open-Access-Journal veröffentlichten Studie erreichte ein neues medizinisches Large-Language-Modell (LLM) eine Genauigkeit von über 91 Prozent bei der Identifizierung weiblicher Teilnehmer, bei denen eine schwere depressive Störung diagnostiziert wurde, nachdem eine kurze WhatsApp-Audioaufzeichnung analysiert wurde, in der die Teilnehmer ihre Woche beschrieben PLOS Psychische Gesundheit von Victor HO Otani von der Santa Casa de São Paulo School of Medical Sciences und Infinity Doctors Inc., Brasilien, und Kollegen.
Eine schwere depressive Störung ist eine psychische Erkrankung, von der weltweit über 280 Millionen Menschen betroffen sind, und eine frühzeitige Erkennung kann für eine rechtzeitige Behandlung von entscheidender Bedeutung sein. Hier verwendeten Otani und Kollegen Modelle des maschinellen Lernens, um Personen mit und ohne schwere depressive Störung anhand von WhatsApp-Sprachnachrichten zu klassifizieren.
Die Autoren verwendeten für diese Studie zwei Datensätze, einen Datensatz zum Trainieren ihrer LLMs (mit sieben verschiedenen verwendeten Untermodellen) und einen Datensatz zum Testen ihrer LLMs. Der Trainingsdatensatz bestand aus 86 Teilnehmern: einer Gruppe ambulanter Patienten (37 Frauen, 8 Männer), bei denen klinisch eine schwere depressive Störung diagnostiziert wurde, und einer Kontrollgruppe aus 41 Freiwilligen (30 Frauen, 11 Männer), bei denen keine Depression diagnostiziert wurde. Der zum Testen der trainierten Modelle verwendete Datensatz bestand aus 74 Teilnehmern: 33 ambulanten Patienten (17 Frauen, 16 Männer), bei denen eine schwere depressive Störung diagnostiziert wurde, und 41 Teilnehmern der Kontrollgruppe (21 Frauen, 20 Männer) ohne diagnostizierte Depression. Alle Teilnehmer erhielten eine Einverständniserklärung und wurden untersucht, um potenzielle Störfaktoren wie andere medizinische Probleme auszuschließen. Im Trainingsdatensatz wurden ambulante Sprachdaten aus WhatsApp-Audioaufzeichnungen entnommen, die an die Arztpraxen gesendet wurden, als sie Symptome zeigten; Die Teilnehmer der Kontrollgruppe wählten ihre eigenen routinemäßigen WhatsApp-Audio-Sprachnachrichten zum Teilen. Für den Testdatensatz waren die Sprachdaten der ambulanten Gruppe und der Kontrollgruppe identisch: aufgezeichnete WhatsApp-Nachrichten mit der Zählung von 1 bis 10 sowie Audionachrichten, die die vergangene Woche beschreiben. Alle Audionachrichten in beiden Datensätzen stammten von brasilianischen Portugiesisch-Muttersprachlern.
Die LLMs zeigten eine höhere Genauigkeit bei der Klassifizierung von Frauen im Vergleich zu Männern als depressiv vs. nicht depressiv, insbesondere wenn die „Beschreiben Sie Ihre Woche“-Daten gegeben wurden, mit einer Genauigkeitsrate von 91,9 Prozent für das leistungsstärkste Modell. Die Genauigkeit des leistungsstärksten Modells bei der Klassifizierung männlicher Teilnehmer betrug 75 Prozent für das gleiche „Beschreiben Sie Ihre Woche“-Audio. (Dies kann möglicherweise durch die höhere Anzahl weiblicher Teilnehmer am Modelltrainingsdatensatz sowie durch Unterschiede in den Sprachmustern zwischen Männern und Frauen erklärt werden.) Die LLMs zeigten eine ähnlichere Leistung zwischen Männern und Frauen, wenn die Daten „bis 10 zählen“ gegeben wurden, wobei das leistungsstärkste Modell bei Frauen eine Genauigkeit von 82 Prozent und bei Männern eine Genauigkeit von 78 Prozent hatte.
Die Autoren sind zuversichtlich, dass die kontinuierliche Weiterentwicklung ihrer Modelle eine kostengünstige und praktische Möglichkeit zum Screening von Personen auf Depressionen sowie für andere potenzielle klinische/wissenschaftliche Anwendungen schaffen könnte.
Unsere Studie zeigt, dass subtile akustische Muster in spontanen WhatsApp-Sprachnachrichten mithilfe maschinellen Lernens dabei helfen können, depressive Profile mit überraschender Genauigkeit zu identifizieren. Dies eröffnet einen vielversprechenden Weg für praxisnahe digitale Screening-Tools mit geringem Aufwand, die die täglichen Kommunikationsgewohnheiten der Menschen berücksichtigen.“
Lucas Marques, leitender Autor
Quellen:
Otani, V. H. O., et al. (2026) ML-based detection of depressive profile through voice analysis in WhatsApp™ audio messages of Brazilian Portuguese Speakers. PLOS Mental Health. DOI: 10.1371/journal.pmen.0000357. https://journals.plos.org/mentalhealth/article?id=10.1371/journal.pmen.0000357