Frauengesundheit

AI identifiziert neuartige Genvarianten, die mit Alzheimer -Risiko verbunden sind

Neue KI-gesteuerte Forschungsergebnisse zeigen, wie fortschrittliche Modelle für maschinelles Lernen nicht nur die bekannten Alzheimer-Gene bestätigen, sondern auch sechs neue Risikovarianten erkennen.

Studie: maschinelles Lernen in der Alzheimer -Krankheit Genetik. Bildnachweis: Kateryna Kon/Shutterstock.com

Statistische Instrumente sind wichtig, um die genetische Grundlage komplexer Erkrankungen auszupacken. Es ist nicht viel Fortschritt über lineare additive Modelle aufgetreten. Eine kürzlich veröffentlichte Arbeit in Naturkommunikation beschreibt das Ergebnis der Anwendung des maschinellen Lernens (ML) auf genomische Daten aus einer großen Kohorte von Alzheimer -Krankheitspatienten (AD) in Europa.

Einführung

Genomweite Assoziationsstudien (GWAS) haben als Risikofaktor für AD tiefere Einblicke in die genetische Variation geleistet. Diese Varianten werden in polygene Risikowerte (PRS) einbezogen, die dazu beitragen, das Krankheitsrisiko vorherzusagen.

Diese Tools sind auf der Annahme ausgelegt, dass Varianten das Ergebnis einheitlich vorhersagen. Mit einzelnen Varianten verbundene Risiken werden hinzugefügt, unabhängig davon, ob diese Varianten an derselben oder anderen genetischen Loci auftreten. Dies ignoriert das Wissen, dass Risiken durch Wechselwirkungen zwischen den Varianten und anderen Risikofaktoren geändert werden.

AD -Forschung hat zum Beispiel gezeigt, dass dies anders ist Apoe Varianten verändern die Krankheitsmerkmale und die Art der immunzellulären Reaktion auf abnormale neuronale Proteine. Genetische Studien zeigen, dass Unterschiede in Apoe Die Expression führt zu unterschiedlichen AD-Gen-Assoziationen und unterschiedlichem Alter bei der Diagnose.

Mit zunehmender Stichprobengrößen für GWAS und der Leistung von PRS -Plateaus sind neuere Plattformen, die fortschrittliche Rechenressourcen anwenden, von wesentlicher Bedeutung, um den maximalen Nutzen aus derzeit verfügbaren großen Daten zu quetschen und die genetische Grundlage der AD besser zu betrachten. Künstliche Intelligenz in ML -Modellen wurde in mehreren Studien angewendet. Kleine Stichprobengrößen haben jedoch ein signifikant hohes Verzerrungsrisiko verursacht.

In der aktuellen Studie wurde dies mit dem größten derzeit verfügbaren genomweiten Datensatz für die AD angewendet.

Über die Studie

In dieser Studie haben die Forscher drei Arten von Modellen ausgebildet, die in diesem Bereich bekannt und leistungsstark sind:

  • Gradienten -Boosting -Maschinen (GBM)
  • BIOLOGISCHE STANDWAY-FORMAL NEURNELNELNEN (NNS)
  • Modellbasierte Multifaktordimensionalitätsreduzierung (MB-MDR).

Ziel war es, die Wirksamkeit jedes Algorithmus bei der Ausführung von drei Arten von Aufgaben zu bewerten:

  • Frühere Erkenntnisse replizieren
  • Finden neuer krankheitsassoziierter Loci von GWAS übersehen
  • Vorhersage von Personen mit hohem Risiko

Die Studie verwendete strenge Kreuzvalidierung, mehrere zufällige Zugtests und sorgfältige Anpassung an Störfaktoren wie Geschlecht, Alter, Genotypisierungszentrum und Populationsstruktur.

Ergebnisse

Frühere Erkenntnisse replizieren

In Bezug auf das erste Ziel zeigten die Ergebnisse, dass ML alle genetischen Varianten, die das gesamte Genom im Trainingssatz überspannen, erfasst haben. Darüber hinaus wurden 22% der AD-assoziierten Varianten identifiziert, die in größeren GWAS-Metaanalysen angegeben wurden, obwohl die Stichprobengröße nur ein zwanzigstes war. Daher setzt diese Studie einen Benchmark für genomweite ML-basierte Methoden.

Die Fähigkeit der ML -Modelle, die Ergebnisse aus viel größeren GWAs zu replizieren, hebt hervor, dass flexible Modelle einen erheblichen Teil des bekannten genetischen Risikos mit einer geringeren Anzahl von Proben wiederherstellen können.

Identifizierung genetischer Loci

Zweitens ml korrekt identifiziert Apoe als Risikofaktor für AD. Es erfasste die Blei-Einzelnukleotidpolymorphismen (SNPs), die kausal mit AD verwandt sind. Bei Methoden hinwies ML die Blei -SNPs für mehrere wichtige Gene in AD. MB-MDR 1 D fand 20 hochstabil Apoe Region, mit jedem möglichen Zugtest.

Die Modelle identifizierten auch sechs neue Loci, die in einem nicht verwandten Datensatz repliziert wurden. Diese Loci codieren Gene wie ARHGAP25Anwesend Ly6hUnd COG7. GBMs identifizierten die neuesten Loci.

Eine neuartige Assoziation wurde in festgestellt AP4E1in der Nähe der bereits Bekannten Sppl2a Ort. AP4E1 codiert einen Teil eines Proteinschlüssels zum Amyloidstoffwechsel, und sein Mangel kann die Beta-Amyloid-Bildung fördern und das AD-Risiko erhöht. Der Ansatz des neuronalen Netzwerks hat auch einen zusätzlichen neuartigen Locus hervorgehoben (SOD1) mit möglichen biologischen Verbindungen zur AD -Pathologie.

Vorhersage des Anzeigenstatus

Alle Modelle prognostizierten den Anzeigenstatus mit vergleichbarer Genauigkeit. GBM war am stärksten mit NN und MDRC 1 d korreliert. Obwohl PRS schwach mit NNS korreliert, war sie stark mit GBM verbunden.

GBM und PRs waren besser vorhersagen, die von Kontrollen unterschiedlich waren. Die Vorhersagen wurden unter Verwendung von zufälligen Trainings- und Testdatenumlagerungen validiert, was auf eine hohe Reproduzierbarkeit hinweist.

Frauen wurden in den vorhergesagten Fällen, wie erwartet von der weiblichen Mehrheit der Daten erwartet, überrepräsentiert. GBM war die Ausnahme mit ähnlichen Anteilen von Männern und Weibchen in beiden Fällen und Kontrollen.

Alle Modellvorhersagen blieben in verschiedenen Kohorten und wiederholten zufälligen Spaltungen stabil, was darauf hindeutet, dass die Ergebnisse nicht durch Überanpassungs- oder technische Artefakte angetrieben werden.

Vergleich mit GWAS

Die Forscher verglichen die primären ML-detektierten Varianten mit allen wichtigen AD-assoziierten SNPs, die in Metaanalysen angegeben wurden. Von 130 zuvor gemeldeten Genen, die 86 Loci entsprechen, haben ein oder mehrere ML -Algorithmen 19 aufgenommen. Alle Modelle identifizierten Apoewährend zwei Modelle sieben Loci erkannten.

Das verlassen Apoe Region aus dem Trainingsdatensatz führte zur Identifizierung bekannterer AD -Risikogene, jedoch mit geringerer Genauigkeit. Wenn nur die aktuellen Daten verwendet wurden, identifizierten ein oder mehrere ML-Modelle jedes GWAS-kennzeichnete SNP im Trainingsdatensatz.

Die ML-identifizierten SNPs mit hoher Priorität waren in Mikroglia- und Astrozytenregionen stärker konzentriert. Diese waren an verschiedenen AD-verwandten Wegen beteiligt, wie z. Dieses Molekül bindet an Acetylcholinrezeptoren, die an der Neurotransmission beteiligt sind, und sein Niveau in der Cerebrospinalflüssigkeit korreliert mit dem Schweregrad der AD. Andere werden auf Glykosylierungsanomalien zurückgeführt, die bei der AD -Tau -Proteinverarbeitung beteiligt sind.

Die Art und Weise, wie ML-Modelle die SNP-Bedeutung bewerten (z. B. über Shap-Werte für GBM, Permutation P-Werte für MB-MDR oder Netzwerkgewichte für NN), übersetzt sich nicht immer direkt in die herkömmliche GWAS-Signifikanz und spiegelt grundlegende Unterschiede in der Merkmalsauswahl zwischen ML und traditionellen Statistiken wider.

Bedeutung der Studie

Diese gut betriebene, ausgefeilte Studie betont, dass ML angesichts der großen verfügbaren Datensätze im Vergleich zu traditionellen genomweiten Methoden im Vergleich zu traditionellen genomweiten Methoden vorhersagen kann.

Die mäßige prädiktive Genauigkeit von GWAS-Metaanalysen könnte auf die Heterogenität der eingeschlossenen Studien zurückzuführen sein, die Unterschiede in mehreren relevanten Merkmalen widerspiegeln. Mehr homogene Proben liefern ein höheres Quotenverhältnis als klinische Proben. Einige SNPs, die von ML -Modellen identifiziert wurden, haben möglicherweise nur nachweisbare Effekte in bestimmten Kohorten oder unter bestimmten Bedingungen, die in großen, heterogenen externen Datensätzen möglicherweise nicht sichtbar sind.

Dies erklärt auch, warum alle von den ML -Modellen identifizierten SNPs in externen Datensätzen nicht repliziert werden konnten. Ihre Auswirkungen können nur in bestimmten Situationen signifikant sein und in sehr unterschiedlichen Studien mit unterschiedlichen Kontexten keine genomweite Signifikanz in Bezug auf sehr unterschiedliche Studien zeigen.

Trotzdem beeinflussten die neuartigen SNPs hier biologisch plausible Wege. Weitere Forschungen sind wichtig, um zu verstehen, wie wichtige SNPs von denen identifiziert werden können, die mit verschiedenen Methoden erfasst wurden.

Schlussfolgerungen

Unsere Ergebnisse zeigen, dass maschinelle Lernmethoden eine prädiktive Leistung erzielen können, die mit klassischen Ansätzen in der genetischen Epidemiologie vergleichbar ist. ““ Neben der Vorhersage von Risiken identifizierten sie neue Loci, die von traditionellen GWAS -Ansätzen übersehen wurden.

Insgesamt zeigt diese Arbeit das Versprechen und die aktuellen Einschränkungen von ML in der AD -Genetik. Es bietet eine wertvolle Ergänzung zu GWAS, unterstreicht aber auch die Notwendigkeit einer sorgfältigen Interpretation, Replikation und weiteren methodischen Verfeinerung.

Die aktuelle Studie eröffnet den Weg für die zukünftige Entwicklung und Validierung von ML -Modellen zur Ergänzung herkömmlicher Methoden in der ad -genetischen Forschung.

Laden Sie jetzt Ihre PDF -Kopie herunter!


Quellen:

Journal reference:

Daniel Wom

Daniel Wom ist ein renommierter Webentwickler und SEO-Experte, der in der digitalen Welt eine beeindruckende Karriere aufgebaut hat. Als Betreiber mehrerer Blogs und Online-Magazine erreicht er jeden Monat mehr als 1 Million begeisterte Leser. Sein unermüdlicher Einsatz für Qualität im Web und seine Fähigkeit, die neuesten Trends und Entwicklungen im Webdesign und in der digitalen Kommunikation vorherzusehen und sich daran anzupassen, haben ihn zu einer angesehenen Persönlichkeit in der Branche gemacht. In unserem Portal ist er der führende Kopf hinter dem Import und der Analyse der neuesten Studien.

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert