Last gelesene Sequenzierung revolutioniert die Diagnose seltener Krankheiten

Jeder von 10 Menschen weltweit ist von einer seltenen genetischen Erkrankung beeinflusst, aber etwa 50% von ihnen bleiben trotz rasanter Erhöhung der genetischen Technologie und der Tests nicht diagnostiziert. Selbst wenn eine Person Zugang zu Tests hat, kann der Prozess der Diagnose etwa fünf Jahre oder länger dauern, was für Patienten, die oft Kinder sind, manchmal zu spät ist, um die richtige Behandlung zu beginnen.
Dies ist teilweise darauf zurückzuführen, dass aktuelle klinische Tests eine Methode verwendet, die als Kurzlesen-Sequenzierung bezeichnet wird und in bestimmten Regionen des Genoms nicht auf Informationen zugreifen kann und daher entscheidende Beweise für die Diagnose durchführen können. Die Forscher von UC Santa Cruz setzen sich jedoch vorwärts zu einer modernsten alternativen Methode, die als Lonad-Sequenzierung bezeichnet wird und ein umfassenderes Datensatz für die Ermittlung von Variationen liefern, die Notwendigkeit mehrerer spezieller Tests beseitigt und die Diagnose seltener Krankheiten optimieren kann.
Eine neue Studie zeigt, dass eine langlebige Sequenzierung das Potenzial hat, die Diagnoserate zu verbessern und gleichzeitig die Zeit bis zur Diagnose von Jahren auf Tage zu verringern – in einem einzigen Test und zu viel geringeren Kosten. Die Studie wurde in veröffentlicht in Das American Journal of Human Genetics und unter der Leitung von Kernmitgliedern des UCSC Genomic Institute Professor für Biomolekulare Engineering (BME) Benedikt Paten und Associate Professor für BME Karen Miga sowie der ehemalige UCSC -Postdoktorand -Gelehrte Jean Monlong.
Seltene Krankheiten sind etwas, das die Menschen seit so vielen Jahren Schwierigkeiten haben, und wenn wir eine Sequenzierungstechnologie haben, die diagnostische Tests optimiert, wird das ein großer Beitrag sein – und das haben wir als Teil dieses Papiers getestet. „
Shloka Negi, UC Santa Cruz Bme Ph.D. Student, erster Autor der Papier
„Heute ist die diagnostische Ausbeute der genetischen Sequenzierung frustrierend niedrig“, sagte Paten. „Eine wahrscheinliche Ursache sind die unvollständigen Sequenzierungsmethoden, Varianten und epigenetische Signale in unserer Kohorte.
Seltene Krankheiten finden
Diese Studie konzentrierte sich auf seltene monogene Erkrankungen, die durch eine Störung eines einzelnen Gens verursacht werden.
Wissenschaftler diagnostizieren genetische Erkrankungen, indem sie ihr genetisches Material durchsuchen, um Varianten zu finden – Unterschiede in einem Gen, die verhindern können, dass es ordnungsgemäß funktioniert. Der typische Ansatz für das Finden dieser Varianten verwendet eine Technik, die als Kurzread -Sequenzierung bezeichnet wird und die genetischen Basenpaare – Kombinationen von Adenin (A), Cytosin (C), Guanin (G) und Thymin (T) – in Sequenzen von etwa Jeweils 150-250.
Die Einschränkung der kurzlesenen Sequenzierung besteht jedoch darin, dass sie in bestimmten Regionen des Genoms entscheidende Informationen übersehen kann, wie Muster von Basispaaren, die viel länger als nur 250 Basispaare sind. Es kann auch nicht „Phasen“ durchführen, den Prozess der Bestimmung, welche Varianten von der Mutter geerbt werden und welche vom Vater stammen. Dies kann den Klinikern helfen, zu entdecken, von denen Varianten erbelt werden. Zum Beispiel, wenn zwei Varianten aus demselben übergeordneten, einer von jedem übergeordneten oder überhaupt nicht geerbt werden. Dies kann eine sehr nützliche Information für genetische Diagnosen sein, insbesondere wenn keine elterlichen Daten verfügbar sind.
Im Gegensatz dazu kann eine langlebige Sequenzierung gleichzeitig langwierige DNA-Abschnitte lesen, wodurch Lücken beseitigt werden, die dazu führen können, dass Wissenschaftler und Kliniker wichtige Informationen über die Genvariation übersehen. Langlesene Sequenzierung liefert auch direkte Phasendaten sowie Informationen zur Methylierung, einen chemischen Prozess in DNA, der dazu führt, dass Gene „ein- oder ausgeschaltet“ werden und zu einer Krankheit beitragen können.
„Die langlebige Sequenzierung wird in bestimmten Fällen viel besser sein, und wir unternehmen Schritte, um das zu beweisen“, sagte Negi.
In Methoden führen
Forscher des UC Santa Cruz Genomics Institute haben eine umfassende Geschichte der Innovation und des Fachwissens in der langlebigen Sequenzierung und entwickeln aktiv Methoden zur Optimierung der Sequenzierung und Analyse für eine breite Palette von Anwendungen für Gesundheitsforschung. Viele der Techniken, die Forscher entwickelten, um Leistungen zu erzielen, wie das erste wirklich vollständige Referenzgenom von „Telomer-telomer“, werden jetzt zur Verbesserung der Patientenergebnisse verwendet.
„Wenn frühere Befunde verstärkt wurden, fanden wir heraus, dass die Vorteile der Verwendung langlebiger Sequenzierung durch die Verwendung eines vollständigen, sogenannten Referenzgenoms von ‚Telomer-telomer‘ anstelle des vorhandenen unvollständigen, aber weit verbreiteten genomischen Referenzs erheblich erhöht wurden“, MIGA “ sagte. „Wir gehen davon aus, dass Pangenome – Referenzen, die eine vielfältige menschliche Variation darstellen – noch mehr von neuen langlebigen Sequenzierungstechnologien profitieren werden.“
Die Labors von Paten und Miga haben sich mit Klinikern zusammengetan, um an Fällen von 42 Patienten mit seltenen Krankheiten zu arbeiten – von denen einige durch Kurzreadmethoden oder andere spezielle Tests eine Diagnose erhielten, von denen einige noch nicht diagnostiziert waren. In einigen Fällen hatten die Forscher Zugang zu genetischen Informationen der Eltern, in anderen nicht.
Die langlebige Sequenzierung der Patienten wurde vom MIGA-Labor unter Verwendung der Nanopore-Sequenzierung, einer Methode zur langlebigen Sequenzierung bei UCSC, geführt, um hoch genaue, End-to-End-Lesevorgänge der Genom der Patienten für etwa 1.000 US-Dollar pro Stichprobe zu erreichen.
Die genomischen Daten wurden unter Verwendung von Computermethoden analysiert, die im Paten -Labor entwickelt wurden, um kleine und große Varianten, Phasendaten und Methylierungsdaten zu finden, die alle mit einer Pipeline namens NAPU -Pipeline bezeichnet wurden. Der Analyseprozess dauert je nach Geschwindigkeit der Computerverarbeitung etwa einen Tag oder weniger und kostet 100 US -Dollar.
Fälle lösen
Nach der Sequenzierung und Analyse der Patientendaten stellten die Forscher fest, dass langlesene Lesen einen umfassenderen Datensatz im Vergleich zu dem lieferten, was mit kurzlesener Sequenzierung abgeleitet werden kann.
Die lang gelesene Sequenzierung lieferte für 11 der 42 Patienten in der Kohorte eine schlüssige Diagnose, die alles aus den kurzlesenen Daten sowie zusätzliche Informationen bereitstellen, einschließlich zusätzlicher seltener Kandidatenvarianten, Langstreckenphasing und Methylierung-alle in Ein einzelnes, kostengünstiges und schnelles Protokoll.
Die 11 diagnostizierten Fälle umfassten vier angeborene Nebennierenhypoplasien (eine seltene Erkrankung, bei der die Nebennierenverdünnen vergrößert sind und nicht richtig funktionieren). Das für diese Krankheit verantwortliche Gen befindet sich in einer besonders herausfordernden Region des Genoms – es kann nicht mit kurzer Lesesequenzierungstechnologie charakterisiert werden, und der aktuelle klinische Test ist umständlich und unvollständig.
„Um diese Fälle zu lösen, haben wir ein neues pangenomisches Tool entwickelt, das neue hochwertige Versammlungen wie das Referenzgenom“ Telomere-telomere „integriert“ Stromposition bei INSERM in Frankreich. „Wir waren begeistert zu sehen Das menschliche Genom, das historisch schwer zu untersuchen war. Unsere Ergebnisse ermutigen uns, unseren Ansatz für mehr Krankheiten zu erweitern, die seit langem zum Stillstand stehen. „
Darüber hinaus beinhalteten zwei Fälle Störungen der Geschlechtsentwicklung, während ein seltener Fall von Leydig -Zellhypoplasien aufgrund unterentwickelter Leydig -Zellen in den Hoden die männliche sexuelle Entwicklung beeinflusste. Darüber hinaus wurden endlich vier Fälle von neurologischen Entwicklungsstörungen, die jeweils lange und herausfordernde diagnostische Odysseys repräsentieren, schließlich aufgelöst.
„Lange Lesesequenzierung ist wahrscheinlich der nächstbeste Test für ungelöste Fälle mit überzeugenden Varianten in einem einzelnen Gen oder einem klaren Phänotyp“, sagte Negi. „Es kann als einzelner diagnostischer Test dienen, wodurch die Notwendigkeit mehrerer klinischer Besuche verringert und eine jahrelange diagnostische Reise in eine Frage von Stunden umgewandelt werden muss.“
Im Durchschnitt hatte jeder Patient 280 Gene (einschließlich einiger Mendelianer-Krankheitsgene, die mit ererbten Erkrankungen verbunden sind, die durch Einzelgenmutationen verursacht werden) mit signifikanten Proteinkodierungsregionen, die von langen Lesevorgängen eindeutig abgedeckt und durch kurze Lesevorgänge unentdeckt sind.
„Es gibt so viel mehr von dem Genom, das die langen Lesevorgänge freischalten können“, sagte Negi. „Aber es wird einige Zeit dauern, bis wir diese neuen Informationen, die durch lange Reads enthüllt wurden, vollständig interpretieren können. Diese Daten wurden in unseren klinischen Datenbanken nicht vorhanden Lesevorgänge entdecken etwa 5,8% mehr des Telomer-zu-Telomer-Genoms, auf das kurze Lesevorgänge einfach nicht zugreifen konnten. „
Andere UC Santa Cruz -Forscher, die an dieser Forschung beteiligt sind, sind Brandy McNulty, Ivo Violich, Joshua Gardner, Todd Hillaker und Sara O’Rourke.
Diese Forschung wurde zum Teil von der Chan Zuckerberg -Initiative finanziert.
Quellen:
Negi, S., et al. (2025) Advancing long-read nanopore genome assembly and accurate variant calling for rare disease detection. The American Journal of Human Genetics. doi.org/10.10doi.org/10.1016/j.ajhg.2025.01.00216/j.ajhg.2025.01.002.