Forscher haben ein KI-Tool entwickelt, das dabei helfen kann, festzustellen, ob unbekannte Bakterien genetische Merkmale tragen, die mit Krankheiten in Zusammenhang stehen. Durch die Möglichkeit, schädliche Bakterien zu erkennen, bevor sie Menschen infizieren, könnte dies die Vorbereitung auf eine Pandemie verändern.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

PathogenFinder2 ist ein neues KI-Tool, das von Forschern der DTU in Dänemark in Zusammenarbeit mit internationalen Partnern entwickelt wurde, um festzustellen, ob ein unbekanntes Bakterium genetische Merkmale besitzt, die mit der Fähigkeit, Krankheiten zu verursachen, verbunden sind. Die Forschung wurde veröffentlicht in Bioinformatikeine der weltweit führenden Fachzeitschriften für Bioinformatik und Computational Biology. Die Forschung könnte die Pandemievorsorge deutlich stärken.

Der Zweck von PathogenFinder2 besteht nicht nur darin, Bakterien zu charakterisieren, von denen bereits bekannt ist, dass sie mit Krankheiten in Zusammenhang stehen, sondern auch darin, die potenzielle Bedrohung durch neue Bakterien einzuschätzen, noch bevor die erste Infektion aufgetreten ist. Dies könnte den Behörden bessere Möglichkeiten geben, Ausbrüche zu verhindern, anstatt nur darauf zu reagieren.“

Professor Frank Møller Aarestrup, Leiter der Forschungsgruppe für Genomische Epidemiologie am DTU National Food Institute

Das neue KI-Tool ist Teil der Global Pathogen Analysis Platform (GPAP) und als kostenloser Onlinedienst öffentlich verfügbar.

„Mit PathogenFinder2 können Abwässer, gesunde Menschen und Tiere untersucht und Bakterien mit pathogenem Potenzial identifiziert werden, bevor sie ihre erste Infektion verursacht haben. Dies bietet eine Grundlage für die Entwicklung von Tests, Impfstoffen und Behandlungen viel früher“, sagt Forscher Alfred Ferrer Florensa, der sein Doktorandenprojekt zu PathogenFinder2 am DTU National Food Institute durchgeführt hat.

Warum es schwierig ist, riskante Bakterien zu identifizieren

Die meisten Bakterien in unserer Umgebung sind harmlos und viele unterstützen die menschliche Gesundheit, indem sie die Verdauung unterstützen, die Haut schützen oder zur Nahrungsmittelproduktion beitragen. Doch ein kleiner Bruchteil kann schwere Infektionen verursachen.

Der Klimawandel, wachsende Ökosysteme und die zunehmende Erforschung der mikrobiellen Vielfalt führen dazu, dass Forscher auf mehr Bakterienarten als je zuvor stoßen, darunter viele ohne vorherige Dokumentation. Die Einschätzung, welche davon ein Risiko darstellen könnten, ist daher eine wachsende Herausforderung.

Um festzustellen, ob ein Bakterium Krankheiten verursachen kann, sind traditionell Laborexperimente erforderlich, die langsam, teuer und oft inkonsistent sind. Computergestützte Ansätze haben dazu beigetragen, diesen Prozess zu beschleunigen, aber die meisten basieren auf dem Vergleich eines neuen Organismus mit bekannten Krankheitserregern – eine Methode, die fehlschlägt, wenn keine nahen Verwandten vorhanden sind.

„Es war nicht nur wichtig, genaue Vorhersagen über bakterielle Bedrohungen zu treffen, die denen ähneln, die wir bereits kennen, sondern auch auf das Auftreten eines völlig neuen und bisher unbekannten krankheitsverursachenden Bakteriums vorbereitet zu sein“, sagt Alfred Ferrer Florensa.

Was PathogenFinder2 anders macht

PathogenFinder2 führt eine grundlegend neue Strategie ein. Anstatt sich auf die Ähnlichkeit mit bekannten Arten zu verlassen, verwendet das Modell Protein-Sprachmodelle, fortschrittliche KI-Systeme, die auf Millionen von Proteinsequenzen trainiert werden. So wie Textvorhersagetools Muster in der menschlichen Sprache lernen, lernen diese Modelle die Sprache von Proteinen und können so biochemische Signale erkennen, die herkömmlichen Ansätzen entgehen.

„PathogenFinder2 ist eines der ersten Modelle, das ganze Bakteriengenome interpretiert, indem es das enorme Potenzial von Sprachmodellen nutzt. Es schneidet deutlich besser ab als alle vorherigen Modelle, insbesondere wenn es auf Bakterienarten trifft, die wir noch nie zuvor gesehen haben. Darüber hinaus liefert es Erklärungen für seine Vorhersagen“, sagt Ph.D. Alfred Ferrer Florensa.

Die Forscher betonen, dass das Modell interessante Muster und potenzielle Risiken identifizieren kann, die Ergebnisse jedoch noch weiter untersucht werden müssen, bevor endgültige Schlussfolgerungen gezogen werden können.

Verstehen, warum ein Bakterium riskant aussieht

PathogenFinder2 leistet mehr als nur eine Vorhersage. Es hebt die spezifischen Proteine ​​hervor, die die Beurteilung am stärksten beeinflussen.

Dazu können bekannte Virulenzfaktoren wie Toxine oder Bindungsstrukturen (Merkmale, die Bakterien dabei helfen, sich an menschliche Zellen anzuheften) sowie völlig uncharakterisierte Proteine ​​gehören, die bei Krankheiten eine Rolle spielen könnten.

Diese Interpretierbarkeit eröffnet neue Möglichkeiten für die Erforschung von Diagnostika, Impfstoffzielen und Infektionsmechanismen, einschließlich Proteinen, die bisher nicht mit Krankheiten in Zusammenhang gebracht wurden.

Eine Karte des bakteriellen Krankheitspotenzials

Mithilfe von Proteinsprachenmodellen zur Darstellung vollständiger Genome konnten die Forscher auch die erste Bacterial Pathogenic Capacity Landscape erstellen, eine Karte, die zeigt, wie Tausende von Bakterien aufgrund ihrer krankheitsbedingten Merkmale miteinander in Beziehung stehen.

Die Landschaft zeigt Ansammlungen von Bakterien, die ähnliche Gewebe infizieren oder Stoffwechselstrategien teilen, und bietet so eine neue Möglichkeit, die mikrobielle Evolution und Wechselwirkungen zu erforschen.

„Die Bacterial Pathogenic Capacity Landscape liefert den ersten Überblick über alle krankheitserregenden Bakterien, mit denen Menschen infiziert werden können. Sie zeigt Muster auf und kann beispielsweise zeigen, welche Bakterien dazu neigen, dieselben Körperstellen zu infizieren oder möglicherweise auf ähnliche Nährstoffe angewiesen sind. Dies gibt uns neue Möglichkeiten, zu untersuchen, wie sich Bakterien entwickeln und interagieren“, sagt Alfred Ferrer Florensa.

Auf 21.000 Bakteriengenomen trainiert

Die Forscher stellten den bisher größten Datensatz von Bakteriengenomen mit bekanntem krankheitserregendem Potenzial oder bekanntem nicht pathogenem Verhalten zusammen.

Der Datensatz bestand aus mehr als 21.000 Bakteriengenomen aus internationalen Datenbanken, darunter aus menschlichen Infektionen isolierte Bakterien, das gesunde menschliche Mikrobiom, probiotische Kulturen, die Lebensmittelproduktion und extreme Umgebungen, wie zum Beispiel Organismen, die unter sehr heißen oder sehr kalten Bedingungen überleben können.

Dies gab dem Modell eine einzigartige Grundlage für die Unterscheidung zwischen schädlichen und harmlosen Bakterien, selbst wenn es auf zuvor unbeschriebene Arten trifft.


Quellen:

Journal reference:

Florensa, A. F., et al. (2026). Whole-genome prediction of bacterial pathogenic capacity on novel bacteria using protein language models with PathogenFinder2. Bioinformatics. DOI: 10.1093/bioinformatics/btag129. https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btag129/8532520?