Die KI-Chatbox hilft bei der Erforschung komplexer Biologie in englischer Sprache

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Mithilfe hochentwickelter RNA-Sequenzierungstechnologie können biomedizinische Forscher die Aktivität unserer Gene in Millionen einzelner Zellen messen und so detaillierte Karten von Geweben, Organen und Krankheiten erstellen. Die Analyse dieser Datensätze erfordert eine seltene Kombination von Fähigkeiten: tiefes Verständnis der Biologie und die Fähigkeit, Computercode zu entwickeln, der Daten in Erkenntnisse umwandelt. Was wäre, wenn wir biomedizinische …

Die KI-Chatbox hilft bei der Erforschung komplexer Biologie in englischer Sprache

Mithilfe hochentwickelter RNA-Sequenzierungstechnologie können biomedizinische Forscher die Aktivität unserer Gene in Millionen einzelner Zellen messen und so detaillierte Karten von Geweben, Organen und Krankheiten erstellen. Die Analyse dieser Datensätze erfordert eine seltene Kombination von Fähigkeiten: tiefes Verständnis der Biologie und die Fähigkeit, Computercode zu entwickeln, der Daten in Erkenntnisse umwandelt. Was wäre, wenn wir biomedizinische Forscher mit einem KI-Assistenten ausstatten könnten, der die Daten sieht, die Analyse unterstützt, sich mit der Biologie auskennt und mit dem man leicht sprechen kann? Damit könnte den Wissenschaftlern ein virtueller, KI-basierter Kollege mit biologischem und bioinformatischem Fachwissen zur Seite stehen, der sie bei ihrer Forschung unterstützt.

Zu diesem Zweck haben Forscher um Christoph Bock, Principal Investigator am CeMM Forschungszentrum für Molekulare Medizin der Österreichischen Akademie der Wissenschaften und Professor an der Medizinischen Universität Wien, CellWhisperer entwickelt. CellWhisperer ist eine KI-Methode und ein Softwaretool, das die Genexpression mit beschreibendem Text in mehr als einer Million biologischen Proben verknüpft. Es bietet eine KI-Chatbox zur Untersuchung komplexer Biologie in englischer Sprache, ohne von der Komplexität des Computercodes belastet zu werden. Diese in Nature Biotechnology veröffentlichte Studie zeigt, wie KI Wissenschaftlern eine neue Möglichkeit bietet, mit ihren Daten zu interagieren, wenn sie die biologischen Grundlagen von Krankheiten untersuchen.

Von den Genen zum Text – und umgekehrt

CellWhisperer nutzt multimodales Deep Learning für Genaktivitätsprofile und passenden biologischen Text, den die Autoren mithilfe von KI-Modellen aus öffentlichen Datenbanken kuratiert haben. Durch die Kombination dieser beiden Datenmodalitäten wird es möglich, riesige Datensätze mit textbasierten Abfragen zu durchsuchen, z „Zeigen Sie mir Immunzellen aus dem entzündeten Dickdarm von Patienten mit Autoimmunerkrankungen.“

Die multimodale KI von CellWhisperer integriert außerdem ein großes Sprachmodell, das darauf trainiert wurde, Diskussionen zwischen Biologen und Bioinformatikern bei der Datenanalyse zu emulieren. Das Chatten mit CellWhisperer klingt daher ein wenig wie ein Gespräch mit einem Bioinformatik-Kollegen, das sich auf CellWhisperers Sicht auf die biologischen Daten und das biologische Wissen des großen Sprachmodells verlässt. Benutzer können CellWhisperer beispielsweise nach Genen fragen, die in den Zellen von Interesse aktiv sind, und das Modell zu möglichen biologischen Auswirkungen kommentieren lassen. CellWhisperer ist in ein benutzerfreundliches Web-Frontend integriert, das auf dem beliebten CELLxGENE-Browser basiert und online frei zugänglich ist:

„Durch das Training anhand experimenteller Daten von 20.000 Studien aus den letzten zwei Jahrzehnten lernte CellWhisperer etwas über die biologischen Rollen von Genen und Zellen“, erklärt Co-Erstautor Moritz Schaefer, ehemaliger Postdoktorand in Christoph Bocks Forschungsgruppe am CeMM und jetzt an der Stanford University. „Auf diese Weise ist CellWhisperer darauf vorbereitet, neue Einzelzell-RNA-Sequenzierungsdaten aus vielen Bereichen zu analysieren, was die Erkundung biomedizinischer Daten einfacher und spannender macht.“

Ein Schritt in Richtung KI-Forschungsagenten

Um das Potenzial von CellWhisperer für biologische Entdeckungen zu veranschaulichen, wandte das Team es auf Einzelzell-RNA-Sequenzierungsdaten der menschlichen Embryonalentwicklung an. Mit einfachen Abfragen wie „Herz“ oder „Gehirn“ identifizierte das Modell Entwicklungszeitpunkte, Zellpopulationen und Markergene, die mit der Bildung menschlicher Organe verbunden sind. Viele dieser Marker stimmten mit bekannten Entwicklungsgenen überein, während andere auf zuvor übersehene Kandidaten hinwiesen.

CellWhisperer erleichtert nicht nur die biomedizinische Forschung, sondern hilft mir auch zu verstehen, was in den Zellen, die ich untersuche, vor sich geht.“

Peter Peneder, Co-Erstautor, St. Anna Children’s Cancer Research Institute

„Wissenschaft ist Teamarbeit, und mit CellWhisperer hat sich ein KI-Forschungsassistent unserem Team angeschlossen. CellWhisperer hilft wirklich bei der explorativen Forschung – einen ersten Eindruck von einem neuen Datensatz zu bekommen und herauszufinden, wo man tiefer graben muss. Es unterstützt und befähigt uns als menschliche Wissenschaftler“, betont Christoph Bock.


Quellen:

Journal reference:

Schaefer, M., et al. (2025). Multimodal learning enables chat-based exploration of single-cell data. Nature Biotechnology. doi: 10.1038/s41587-025-02857-9. https://www.nature.com/articles/s41587-025-02857-9