Maschinelles Lernen zeigt, wie Metabolitenprofile Alterung und Gesundheit vorhersagen
Metabolitendaten und KI definieren zusammen neu, wie wir das Altern messen und die Gesundheitsspanne vorhersagen.
In einer kürzlich in der Zeitschrift veröffentlichten Studie Wissenschaftliche FortschritteForscher am King’s College London erforschten metabolische Alterungsuhren mithilfe von Modellen für maschinelles Lernen, die auf Plasmametabolitendaten der Biobank des Vereinigten Königreichs (UK) trainiert wurden. Ziel der Studie war es, das Potenzial metabolomischer Alterungsuhren bei der Vorhersage von Gesundheitsergebnissen und Lebenserwartung zu bewerten, indem ihre Genauigkeit, Robustheit und Relevanz für biologische Alterungsindikatoren über das chronologische Alter hinaus verglichen wurden.
Hintergrund
Die biologische Alterung spiegelt im Gegensatz zum chronologischen Alter molekulare und zelluläre Schäden wider, die die Gesundheit und Krankheitsanfälligkeit beeinflussen. Das chronologische Alter allein kann die Variabilität der altersbedingten physiologischen Zustände zwischen Individuen nicht erfassen. Jüngste Fortschritte in den Omics-Technologien, insbesondere in der Metabolomik, haben jedoch Einblicke in das biologische Altern durch molekulare Profilierung ermöglicht.
Metaboliten oder kleine Moleküle aus Stoffwechselwegen können Beurteilungen der physiologischen Gesundheit liefern und sind mit altersbedingten Folgen wie chronischen Krankheiten und Mortalität verbunden. Frühere Studien korrelierten metabolische Daten mit dem Altern, waren jedoch durch begrenzte Stichprobengrößen und Marker eingeschränkt.
Jüngste Bemühungen, „Alterungsuhren“ mithilfe maschinellen Lernens aus Omics-Daten abzuleiten, haben eine erhebliche Vorhersagekraft für Gesundheitsergebnisse gezeigt. Allerdings gibt es weiterhin Herausforderungen bei der Optimierung dieser Modelle hinsichtlich Genauigkeit und Interpretierbarkeit, insbesondere unter Verwendung der Metabolomik.
Die aktuelle Studie
Die vorliegende Studie nutzte Kernspinresonanzspektroskopie (NMR), um Plasmametabolitendaten aus der britischen Biobank zu analysieren, an der 225.212 Teilnehmer im Alter zwischen 37 und 73 Jahren teilnahmen. Zu den Ausschlusskriterien gehörten Schwangerschaft, Dateninkonsistenzen und extreme Metabolitenwerte. Der Datensatz umfasste 168 Metaboliten, die Lipidprofile, Aminosäuren und Glykolyseprodukte repräsentierten.
Die Forscher wandten 17 maschinelle Lernalgorithmen, darunter lineare Regression, baumbasierte Modelle und Ensemble-Techniken, auf den Datensatz an, um metabolomische Alterungsuhren zu entwickeln. Sie verwendeten außerdem einen strengen verschachtelten Kreuzvalidierungsansatz, um eine robuste Modellbewertung sicherzustellen.
Zu den wichtigsten Vorverarbeitungsschritten gehörten der Umgang mit ausgefallenen Metabolitenwerten und die Korrektur der den Modellen innewohnenden Altersvorhersageverzerrungen. Die Vorhersagemodelle zielten darauf ab, das chronologische Alter mithilfe von Metabolitenprofilen abzuschätzen, und die Unterschiede zwischen vorhergesagtem und tatsächlichem Alter wurden als „MileAge-Delta“ definiert. Statistische Korrekturen wurden umfassend durchgeführt, um systematische Verzerrungen zu beseitigen und die Vorhersagegenauigkeit zu verbessern, insbesondere für jüngere und ältere Altersgruppen.
Die Vorhersagegenauigkeit der Modelle wurde anhand von Metriken wie dem mittleren absoluten Fehler (MAE), dem quadratischen Mittelfehler (RMSE) und Korrelationskoeffizienten bewertet. Beispielsweise erreichte das kubistische Regressionsmodell eine MAE von 5,31 Jahren und übertraf damit andere Modelle wie multivariate adaptive Regressions-Splines (MAE = 6,36 Jahre). Durch weitere Analysen wurden die Vorhersagen angepasst, um systematische Verzerrungen zu beseitigen und ihre Ausrichtung auf das chronologische Alter zu verbessern.
Studiendesign und Überblick. (A) Überblick über den verschachtelten Kreuzvalidierungsansatz. MAE, mittlerer absoluter Fehler; RMSE, quadratischer Mittelwertfehler. (B) Histogramm der chronologischen Altersverteilung der Analyseprobe. Der Statistikmodus (Alter, 61 Jahre) wird rot angezeigt. (C) Verteilung der Metabolitenspiegel nach chronologischem Alter, mit Streudiagrammen aller Beobachtungen und glatten Kurven (beachten Sie den Unterschied in der Y-Achsenskala). Die glatten Kurven wurden mithilfe verallgemeinerter additiver Modelle geschätzt, wobei die schattierten Bereiche 95 %-Konfidenzintervallen (CIs) entsprechen. GlycA, Glykoproteinacetyle. (D) Streudiagramm, das die Hazard Ratio (HR) für die Gesamtmortalität und das Beta für das chronologische Alter zeigt, die mit einem Unterschied von einer Standardabweichung in den Metabolitenspiegeln verbunden sind. Metaboliten, die statistisch signifikante Assoziationen sowohl mit dem chronologischen Alter als auch mit der Gesamtmortalität aufwiesen, werden in Lila angezeigt.
Ergebnisse
Die Ergebnisse zeigten, dass metabolomische Alterungsuhren, die aus Plasmametabolitenprofilen entwickelt wurden, das biologische Altern effektiv vom chronologischen Altern unterscheiden könnten. Von den verschiedenen in der Studie getesteten Modellen lieferte das kubistische regelbasierte Regressionsmodell die stärksten prädiktiven Zusammenhänge mit Gesundheitsmarkern und Mortalität und übertraf die anderen Algorithmen in Bezug auf Genauigkeit und Robustheit.
Darüber hinaus waren positive MileAge-Delta-Werte, die auf eine beschleunigte Alterung hindeuteten, mit Gebrechlichkeit, kürzeren Telomeren, höherer Morbidität und einem erhöhten Mortalitätsrisiko verbunden. Konkret entsprach ein einjähriger Anstieg des MileAge-Deltas einem Anstieg des Gesamtmortalitätsrisikos um 4 %, wobei die Hazard Ratios (HR) in extremen Fällen 1,5 überstiegen.
Darüber hinaus zeigte die Studie, dass Personen mit beschleunigtem Altern eher über eine schlechtere Selbsteinschätzung ihrer Gesundheit berichten und an chronischen Krankheiten leiden. Besonders ausgeprägt waren Zusammenhänge mit Gebrechlichkeit und Telomerabnutzung, wobei einige Unterschiede einer 18-jährigen Ungleichheit der Gebrechlichkeitsindexwerte entsprachen. Interessanterweise wiesen Frauen bei den meisten Modellen etwas höhere MileAge-Deltas auf als Männer.
Die Studie bestätigte auch die nichtlineare Natur der Beziehungen zwischen Metaboliten und Alter und betonte den Nutzen statistischer Korrekturen für die Verbesserung der Vorhersagegenauigkeit. Darüber hinaus zeigte der Vergleich vorhandener Alterungsmarker, dass metabolomische Alterungsuhren einzigartige gesundheitsrelevante Signale erfassten und die einfacheren Prädiktoren häufig übertrafen. Die Ergebnisse zeigten jedoch, dass eine verlangsamte Alterung (negative MileAge-Deltas) nicht durchgängig zu besseren Gesundheitsergebnissen führte, was die Komplexität biologischer Alterungsmetriken unterstreicht.
Schlussfolgerungen
Insgesamt zeigte die Studie den Nutzen metabolomischer Alterungsuhren bei der Vorhersage des biologischen Alterns und der damit verbundenen gesundheitlichen Folgen. Durch den Vergleich mehrerer Algorithmen für maschinelles Lernen zeigten die Ergebnisse auch die überlegene Leistung des kubistischen regelbasierten Modells bei der Verknüpfung von aus Metaboliten abgeleiteten Altersstufen mit Gesundheitsmarkern und Mortalität.
Die Ergebnisse deuten darauf hin, dass metabolomische Alterungsuhren Potenzial für ein proaktives Gesundheitsmanagement und eine Risikostratifizierung bergen, und unterstreichen die Notwendigkeit einer weiteren Validierung über verschiedene Populationen hinweg und Längsschnittdaten für eine breitere klinische Anwendung. Diese Studie setzt neue Maßstäbe für die Algorithmenentwicklung und zeigt, wie metabolomische Profile umsetzbare Erkenntnisse über Alterung und Gesundheit liefern können.
Quellen:
- Mutz, J., Iniesta, R., & Lewis, C. M. (2024). Metabolomic age (MileAge) predicts health and life span: A comparison of multiple machine learning algorithms. Science Advances. https://www.science.org/doi/10.1126/sciadv.adp3743