Was macht Depressions-Apps sicher, effektiv und vertrauenswürdig?

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Die Studie zeigt einen klareren Weg zur Identifizierung von Depressions-Apps auf, die sicher, wirksam und empfehlenswert sind. Studie: Validierung und Auswahl von Kriterien zur Bewertung von Apps zur Behandlung von Depressionen: eine Delphi-Studie. Bildnachweis: myboys.me/Shutterstock.com In einer aktuellen Studie veröffentlicht in BMJ offenstellten Forscher einen neuartigen, auf Konsens basierenden Rahmen vor, der den Grundstein für …

Was macht Depressions-Apps sicher, effektiv und vertrauenswürdig?

Die Studie zeigt einen klareren Weg zur Identifizierung von Depressions-Apps auf, die sicher, wirksam und empfehlenswert sind.

Studie: Validierung und Auswahl von Kriterien zur Bewertung von Apps zur Behandlung von Depressionen: eine Delphi-Studie. Bildnachweis: myboys.me/Shutterstock.com

In einer aktuellen Studie veröffentlicht in BMJ offenstellten Forscher einen neuartigen, auf Konsens basierenden Rahmen vor, der den Grundstein für ein zukünftiges Bewertungstool legt, das Experten und Verbrauchern dabei helfen soll, die Fülle mobiler Gesundheits-Apps (mHealth) zu bewerten, die auf Depressionen und Unterstützung bei der psychischen Gesundheit abzielen.

Das Framework verwendete eine modifizierte Delphi-Methode, an der Gesundheitsfachkräfte, Technologieexperten und Patienten beteiligt waren, um 51 potenzielle Bewertungsmetriken vorzuschlagen und zu überprüfen, die anschließend in 28 wesentliche Kriterien destilliert wurden, die für die Verwendung in einem strukturierten App-Bewertungstool vorgesehen waren.

Die Studienergebnisse zeigten, dass Datenschutz und klinische Wirksamkeit bei den Teilnehmern eine starke Priorität gegenüber anderen häufig hervorgehobenen App-Funktionen wie Engagement und Selbstverfolgung haben. Diese Erkenntnisse werden insbesondere die Grundlage für „EvalDepApps“ bilden, ein zukünftiges Tool, das Anwendern und Klinikern dabei helfen soll, sichere, evidenzbasierte digitale Interventionen zu identifizieren.

Warum die Wahl einer vertrauenswürdigen Depressions-App weiterhin schwierig ist

Eine depressive Störung, oder allgemein einfach nur Depression genannt, ist ein Spektrum psychischer Erkrankungen, die durch anhaltende Gefühle der Traurigkeit gekennzeichnet sind und häufig zu beobachtbaren Veränderungen im Verhalten und im täglichen (Routine-)Betrieb führen. Die Krankheit nimmt weltweit mit beispielloser Geschwindigkeit alarmierend zu und betrifft Berichten zufolge etwa 5 % der erwachsenen Bevölkerung weltweit.

Während die Weltgesundheitsorganisation (WHO) das Potenzial aufkommender digitaler Technologien zur Überbrückung von Versorgungslücken betont, ist die Realität des App Stores oft unklar. Eine kürzlich veröffentlichte Analyse ergab, dass von 30 Depressions-Apps, die einer eingehenden Prüfung unterzogen wurden, nur 26,7 % durch wissenschaftliche Beweise gestützt wurden.

Darüber hinaus unterliegen mobile Gesundheits-Apps (mHealth), die auf Depressionen und die Unterstützung der psychischen Gesundheit abzielen, selten einem Standardisierungs- oder Regulierungsdruck. Derzeit sind Benutzer gezwungen, sich auf subjektive oder nicht überprüfbare Bewertungen zu verlassen, die wenig Einblick in die medizinische Gültigkeit einer App, ihren Umgang mit sensiblen persönlichen Daten oder ihre Übereinstimmung mit klinischen Best Practices geben.

Ein auf Depressionen ausgerichteter Ansatz zur Evaluierung von mHealth würde es Experten und Patienten gleichermaßen ermöglichen, fundierte Entscheidungen zu treffen, wenn sie sich für ihr nächstes digitales Anti-Depressions-Hilfsmittel entscheiden.

Verwendung von Delphi-Methoden zur Definition von Depressions-spezifischen App-Standards

Ziel der vorliegenden Studie war es, diesem dringenden Bedarf gerecht zu werden, indem ein spezifischer, konsensbasierter Kriteriensatz vorgeschlagen wurde, der ausschließlich auf Apps zur Depressionsbehandlung zugeschnitten ist. Die Studie nutzte eine modifizierte Delphi-Studienmethodik, eine strukturierte Kommunikationstechnik, die dazu dient, einen Konsens zwischen einem Expertengremium zu erzielen und dabei zu helfen, die Meinungen, Wahrnehmungen und Prioritäten der einbezogenen Interessengruppen über zwei iterative Bewertungsrunden hinweg zu konsolidieren.

Zu den Interessengruppen, die als Studienteilnehmer bezeichnet werden, gehörten Gesundheitsfachkräfte (Psychiater, Psychologen, Krankenpfleger), Experten für Gesundheitstechnologie und Personen, bei denen eine Depression diagnostiziert wurde. Diese Teilnehmer (n = 43) wurden sorgfältig ausgewählt, um eine ganzheitliche Betrachtung des Themas sowohl aus klinischer als auch aus gelebter Erfahrungsperspektive zu gewährleisten.

Die Studienmethodik begann mit einer vom Autor durchgeführten Literaturrecherche, um mögliche Kriterien für die Standardisierung von mHealth-Apps und die Bewertung ihrer Leistung zu identifizieren. Von den 60 identifizierten potenziellen Kriterien wurden im Rahmen einer internen Überprüfung 51 Kriterien für die Teilnehmerbewertung in die engere Wahl gezogen, wobei neun Kriterien als überflüssig befunden wurden.

Der Teilnehmer- oder Gremiumsbewertungsprozess wurde in zwei Abstimmungsrunden durchgeführt:

  1. Runde 1: Die Teilnehmer bewerteten die Relevanz jedes Kriteriums auf einer 6-stufigen Likert-Skala (0 bis 6).
  2. Runde 2: Kriterien, die in der ersten Runde keinen entscheidenden Konsens erzielten, wurden zusammen mit früheren Abstimmungsergebnissen und zusammenfassendem Feedback zur Neubewertung an das Gremium zurückgesendet.

In die Studienempfehlungen wurden nur die Kriterien aufgenommen, die interne Schwellenwerte mit hohem Konsens erfüllen. Konkret galt ein Kriterium nur dann als hoher Konsens, wenn 80 % oder mehr der Befragten es mit 5 oder 6 bewerteten, was „sehr wichtig“ entspricht.

Was Stakeholder wirklich von Depressions-Apps erwarten

Die zwei Runden der Panel-Überprüfung führten zur Identifizierung von 28 Kriterien (statt 51), die den Vorlieben und Anforderungen sowohl von Experten als auch von Patienten entsprachen. Die Panelbeteiligung war besonders stark: 59 % der eingeladenen Experten antworteten in Runde 1 und 53,4 % in Runde 2.

Die Studienergebnisse zeigten eine überwältigende Priorisierung der Teilnehmer in folgenden Bereichen:

  1. Sicherheit und Datenschutz (25 % der berücksichtigten Kriterien): Alle vorgeschlagenen Kriterien zu Sicherheit und Datenschutz erzielten bereits in der ersten Runde maximalen Konsens. So erreichte beispielsweise ein Kriterium bezüglich der Weitergabe von Daten an Dritte eine 100-prozentige Übereinstimmung.
  2. Klinische Wirksamkeit (25 %): Die Anforderung, dass die Empfehlungen einer App evidenzbasiert sein müssen, erreichte eine Zustimmung von 95,7 %, was ein starkes Interesse an einem nachweisbaren therapeutischen Wert widerspiegelt

Unerwarteterweise und im Gegensatz zu Erkenntnissen aus umfassenderen mHealth-Evaluierungsstudien wurden Kriterien im Zusammenhang mit Gesundheitsindikatoren, wie z. B. die Verfolgung von Schlaf, Ernährung oder sitzenden Gewohnheiten, weitgehend als weniger wichtig erachtet und machten 7,1 % der endgültigen Kriterienliste aus. Die Autoren stellen fest, dass diese Depriorisierung nicht bedeutet, dass diesen Merkmalen der Wert fehlt, sondern dass sie vielmehr begrenzte Belege widerspiegelt, die sie mit verbesserten Depressionsergebnissen in Verbindung bringen, wenn sie isoliert verwendet werden.

Schließlich blieben Benutzerfreundlichkeit und Funktionalität wichtig und machten 17,9 % der endgültigen Liste aus. Die Teilnehmer betonten, dass Apps interpretierbar und schnell reagieren und ihre Ziele klar kommunizieren müssen, um eine nachhaltige und sinnvolle Nutzung zu unterstützen.

Was diese Kriterien für zukünftige Apps für psychische Gesundheit bedeuten

Die vorliegende Studie hebt hervor, dass bei mHealth-Apps, insbesondere solchen, die auf die Linderung von Depressionen abzielen, Sicherheit und wissenschaftliche Validität Vorrang vor weniger klinisch fundierten Funktionen wie Schlaf- oder Diätverfolgung haben müssen. Es führt 28 validierte Kriterien für die Bewertung und Überprüfung von mHealth-Apps ein und bietet Interessenvertretern einen fundierten Weg für zukünftige Bewertungen digitaler Tools zur Depressionsbehandlung, anstatt bestimmte Apps sofort zu empfehlen.

Diese Kriterien werden bei der Optimierung des EvalDepApps-Bewertungstools von entscheidender Bedeutung sein, das medizinische Fachkräfte und Benutzer in die Lage versetzen soll, hochwertige Apps zu identifizieren und so sicherzustellen, dass digitale Unterstützung für die psychische Gesundheit nicht nur zugänglich, sondern auch sicher und wissenschaftlich fundiert ist. Die Autoren weisen jedoch darauf hin, dass vor einer breiten Umsetzung, insbesondere in verschiedenen Gesundheitssystemen und kulturellen Umgebungen, weitere Validierung, kontextbezogene Anpassung und Tests in der Praxis erforderlich sein werden.

Laden Sie jetzt Ihr PDF-Exemplar herunter!


Quellen:

Journal reference:
  • Robles, N., et al. (2025). Validation and selection of criteria for evaluating apps for managing depression: a Delphi study. BMJ Open, 15(11), e101302. DOI: 10.1136/bmjopen-2025-101302. https://bmjopen.bmj.com/content/15/11/e101302