Technologie

Der neue Ansatz für maschinelles Lernen verbessert die Einzelzelldatenanalyse

Unser Körper besteht aus rund 75 Milliarden Zellen. Aber welche Funktion unterscheidet sich jede einzelne Zelle und wie stark unterscheiden sich die Zellen einer gesunden Person von denen von jemandem mit einer Krankheit? Um Schlussfolgerungen zu ziehen, müssen enorme Datenmengen analysiert und interpretiert werden. Zu diesem Zweck werden Methoden für maschinelles Lernen angewendet. Forscher der Technischen Universität von München (Tum) und Helmholtz München haben inzwischen das selbstsütige Lernen als vielversprechenden Ansatz zum Testen von 20 Millionen Zellen oder mehr getestet.

In den letzten Jahren haben Forscher erhebliche Fortschritte bei der Single-Cell-Technologie erzielt. Dies ermöglicht es, Gewebe anhand einzelner Zellen zu untersuchen und einfach die verschiedenen Funktionen der einzelnen Zelltypen zu bestimmen. Die Analyse kann zum Beispiel verwendet werden, um Vergleiche mit gesunden Zellen herzustellen, um herauszufinden, wie Rauchen, Lungenkrebs oder eine Covid -Infektion einzelne Zellstrukturen in der Lunge verändern.

Gleichzeitig erzeugt die Analyse immer größere Datenmengen. Die Forscher beabsichtigen, maschinelle Lernmethoden anzuwenden, um den Prozess der Neuinterpretation vorhandener Datensätze zu unterstützen, abschließende Aussagen aus den Mustern abzuleiten und die Ergebnisse auf andere Bereiche anzuwenden.

Selbstdacher Lernen als neuer Ansatz

Fabian Theis hält den Vorsitzenden der mathematischen Modellierung biologischer Systeme bei Tum. Mit seinem Team hat er untersucht, ob das selbstüberwachende Lernen eher für die Analyse großer Datenmengen als andere Methoden geeignet ist. Die Studie wurde kürzlich in Nature Machine Intelligence veröffentlicht. Diese Form des maschinellen Lernens funktioniert mit unbeschriebenen Daten. Im Voraus sind keine klassifizierten Beispieldaten erforderlich. Das bedeutet, dass es nicht erforderlich ist, die Daten im Voraus an bestimmte Gruppen vorzuweisen. Unbeschriebene Daten sind in großen Mengen verfügbar und ermöglichen die robuste Darstellung enormer Datenvolumina.

Das selbstbewertete Lernen basiert auf zwei Methoden. Im maskierten Lernen wird – wie der Name schon sagt – ein Teil der Eingabedaten maskiert und das Modell geschult, um die fehlenden Elemente zu rekonstruieren. Darüber hinaus wenden die Forscher kontrastives Lernen an, bei denen das Modell lernt, ähnliche Daten und unterschiedliche unterschiedliche Daten zu kombinieren.

Das Team verwendete beide Methoden des selbstüberwachenden Lernens, um mehr als 20 Millionen einzelne Zellen zu testen, und verglichen sie mit den Ergebnissen klassischer Lernmethoden. Bei ihrer Einschätzung der verschiedenen Methoden konzentrierten sich die Forscher auf Aufgaben wie die Vorhersage von Zelltypen und die Rekonstruktion der Genexpression.

Aussichten für die Entwicklung virtueller Zellen

Die Ergebnisse der Studie zeigen, dass das selbstbewertete Lernen die Leistung insbesondere mit Übertragungsaufgaben verbessert-dh bei der Analyse kleinerer Datensätze, die durch Erkenntnisse aus einem größeren Hilfsdatensatz informiert werden. Darüber hinaus sind auch die Ergebnisse von Null-Shot-Zell-Vorhersagen-mit anderen Worten, die ohne Vorversion erbrachten Aufgaben-vielversprechend. Der Vergleich zwischen maskiertem und kontrastivem Lernen zeigt, dass maskiertes Lernen für Anwendungen mit großen Einzelzell-Datensätzen besser geeignet ist.

Die Forscher verwenden die Daten, um an der Entwicklung virtueller Zellen zu arbeiten. Dies sind umfassende Computermodelle, die die Vielfalt von Zellen in verschiedenen Datensätzen widerspiegeln. Diese Modelle sind vielversprechend für die Analyse von zellulären Veränderungen, wie beispielsweise bei Krankheiten bezeichnet wird. Die Ergebnisse der Studie bieten wertvolle Erkenntnisse darüber, wie solche Modelle effizienter und weiter optimiert werden können.


Quellen:

Journal reference:

Richter, T., et al. (2024) Delineating the effective use of self-supervised learning in single-cell genomics. Nature Machine Intelligence. doi.org/10.1038/s42256-024-00934-3.

Daniel Wom

Daniel Wom ist ein renommierter Webentwickler und SEO-Experte, der in der digitalen Welt eine beeindruckende Karriere aufgebaut hat. Als Betreiber mehrerer Blogs und Online-Magazine erreicht er jeden Monat mehr als 1 Million begeisterte Leser. Sein unermüdlicher Einsatz für Qualität im Web und seine Fähigkeit, die neuesten Trends und Entwicklungen im Webdesign und in der digitalen Kommunikation vorherzusehen und sich daran anzupassen, haben ihn zu einer angesehenen Persönlichkeit in der Branche gemacht.

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert