Le séquençage en dernière lecture révolutionne le diagnostic des maladies rares
Une personne sur dix dans le monde est touchée par une maladie génétique rare, mais environ 50 % d’entre elles ne sont pas diagnostiquées malgré l’augmentation rapide de la technologie et des tests génétiques. Même si une personne a accès aux tests, le processus de diagnostic peut prendre environ cinq ans, voire plus, ce qui est parfois trop tard pour que les patients, qui sont souvent des enfants, puissent commencer un traitement approprié. Cela est dû en partie au fait que les tests cliniques actuels utilisent une méthode appelée séquençage à lecture courte, qui ne peut pas accéder aux informations dans certaines régions du génome et fournit donc des preuves cruciales pour le diagnostic...
Le séquençage en dernière lecture révolutionne le diagnostic des maladies rares
Une personne sur dix dans le monde est touchée par une maladie génétique rare, mais environ 50 % d’entre elles ne sont pas diagnostiquées malgré l’augmentation rapide de la technologie et des tests génétiques. Même si une personne a accès aux tests, le processus de diagnostic peut prendre environ cinq ans, voire plus, ce qui est parfois trop tard pour que les patients, qui sont souvent des enfants, puissent commencer un traitement approprié.
Cela est dû en partie au fait que les tests cliniques actuels utilisent une méthode appelée séquençage à lecture courte, qui ne peut pas accéder aux informations dans certaines régions du génome et ne peut donc pas fournir de preuves cruciales pour le diagnostic. Cependant, les chercheurs de l'UC Santa Cruz avancent vers une méthode alternative de pointe, appelée séquençage Lonad, qui peut fournir un ensemble de données plus complet pour identifier les variations, éliminer le besoin de plusieurs tests spécialisés et optimiser le diagnostic des maladies rares.
Une nouvelle étude montre que le séquençage à longue durée de vie a le potentiel d'améliorer les taux de diagnostic tout en réduisant le délai de diagnostic de plusieurs années à quelques jours - en un seul test et à un coût bien inférieur. L'étude a été publiée dansLe Journal américain de génétique humaineet dirigé par les membres principaux du professeur d'ingénierie biomoléculaire (BME) Benedikt Paten et du professeur agrégé de BME Karen Miga, ainsi que par l'ancien chercheur postdoctoral de l'UCSC Jean Monlong.
Les maladies rares sont un problème contre lequel les gens luttent depuis de nombreuses années, et si nous disposons d'une technologie de séquençage qui optimise les tests de diagnostic, cela constituera une contribution énorme - et c'est ce que nous avons testé dans le cadre de cet article. "
Shloka Negi, UC Santa Cruz Bme Ph.D. étudiant, premier auteur de l'article
"Aujourd'hui, le rendement diagnostique du séquençage génétique est extrêmement faible", a déclaré Paten. « Une cause probable réside dans les méthodes de séquençage incomplètes, les variantes et les signaux épigénétiques de notre cohorte.
Trouver des maladies rares
Cette étude s'est concentrée sur les maladies monogéniques rares causées par un trouble d'un seul gène.
Les scientifiques diagnostiquent les maladies génétiques en recherchant dans leur matériel génétique des variantes, c'est-à-dire des différences dans un gène qui peuvent l'empêcher de fonctionner correctement. L’approche typique pour trouver ces variantes utilise une technique appelée séquençage à lecture courte, qui cartographie les paires de bases génétiques – combinaisons d’adénine (A), de cytosine (C), de guanine (G) et de thymine (T) – en séquences d’environ 150 à 250 chacune.
Cependant, la limitation du séquençage à lecture courte est qu’il peut manquer des informations cruciales dans certaines régions du génome, telles que des modèles de paires de bases bien plus longues que 250 paires de bases. Il ne peut pas non plus effectuer de « phasage », le processus consistant à déterminer quelles variantes sont héritées de la mère et lesquelles proviennent du père. Cela peut aider les cliniciens à découvrir quelles variantes sont héritées. Par exemple, lorsque deux variantes sont héritées du même parent, une de chaque parent, ou ne sont pas héritées du tout. Cela peut être une information très utile pour les diagnostics génétiques, surtout lorsque les données parentales ne sont pas disponibles.
En revanche, le séquençage à longue durée de vie peut lire simultanément de longues portions d’ADN, éliminant ainsi les lacunes qui peuvent amener les scientifiques et les cliniciens à manquer des informations importantes sur la variation génétique. Le séquençage à lecture longue fournit également des données de phase directes ainsi que des informations sur la méthylation, un processus chimique dans l'ADN qui provoque l'activation ou la désactivation des gènes et peut contribuer à la maladie.
"Le séquençage à longue durée de vie sera bien meilleur dans certains cas, et nous prenons des mesures pour le prouver", a déclaré Negi.
Mener les méthodes
Les chercheurs de l'Institut de génomique d'UC Santa Cruz ont une vaste histoire d'innovation et d'expertise dans le séquençage à longue durée de vie et développent activement des méthodes pour optimiser le séquençage et l'analyse pour un large éventail d'applications de recherche en santé. Bon nombre des techniques développées par les chercheurs pour réaliser des progrès, comme le premier génome de référence « télomère-télomère » véritablement complet, sont désormais utilisées pour améliorer les résultats pour les patients.
"Si les découvertes précédentes étaient renforcées, nous avons constaté que les avantages de l'utilisation du séquençage à longue durée de vie étaient considérablement accrus en utilisant un génome de référence complet, appelé "télomère-télomère", au lieu de la référence génomique incomplète mais largement utilisée", a déclaré la MIGA. "Nous prévoyons que les pangénomes - références représentant diverses variations humaines - bénéficieront encore plus des nouvelles technologies de séquençage à longue durée de vie."
Les laboratoires Paten et Miga se sont associés à des cliniciens pour travailler sur les cas de 42 patients atteints de maladies rares, dont certains ont été diagnostiqués par des méthodes à lecture courte ou d'autres tests spécialisés, tandis que d'autres n'ont pas encore été diagnostiqués. Dans certains cas, les chercheurs ont eu accès aux informations génétiques des parents, mais dans d’autres non.
Le séquençage à longue durée de vie des patients a été réalisé par le laboratoire MIGA à l'aide du séquençage Nanopore, une méthode de séquençage à longue durée de vie de l'UCSC, afin d'obtenir des lectures de bout en bout très précises du génome des patients pour environ 1 000 $ par échantillon.
Les données génomiques ont été analysées à l’aide de méthodes informatiques développées dans le laboratoire Paten pour trouver des variantes petites et grandes, des données de phase et des données de méthylation, le tout à l’aide d’un pipeline appelé pipeline NAPU. Le processus d'analyse prend environ une journée ou moins, selon la vitesse du traitement informatique, et coûte 100 $.
résoudre des cas
Après avoir séquencé et analysé les données des patients, les chercheurs ont découvert que les lectures à lecture longue fournissaient un ensemble de données plus complet que ce qui pouvait être dérivé à l’aide du séquençage à lecture courte.
Le séquençage à lecture longue a fourni un diagnostic concluant pour 11 des 42 patients de la cohorte, fournissant tout, des données à lecture courte ainsi que des informations supplémentaires, notamment des variantes candidates rares supplémentaires, une phase à longue portée et une méthylation - le tout dans un protocole unique, peu coûteux et rapide.
Les 11 cas diagnostiqués comprenaient quatre hypoplasies surrénales congénitales (une maladie rare dans laquelle les glandes surrénales sont hypertrophiées et ne fonctionnent pas correctement). Le gène responsable de cette maladie est situé dans une région particulièrement complexe du génome : il ne peut pas être caractérisé à l’aide de la technologie de séquençage à lecture courte, et les tests cliniques actuels sont lourds et incomplets.
"Pour résoudre ces cas, nous avons développé un nouvel outil pan-génomique qui intègre de nouveaux assemblages de haute qualité tels que le génome de référence "télomères-télomères" actuellement en place à l'INSERM en France. "Nous étions impatients de voir le génome humain, qui a toujours été difficile à étudier. Nos résultats nous encouragent à élargir notre approche à davantage de maladies qui sont depuis longtemps bloquées. »
En outre, deux cas concernaient des troubles du développement sexuel, tandis qu'un cas rare d'hypoplasie des cellules de Leydig due à des cellules de Leydig sous-développées dans les testicules affectait le développement sexuel masculin. De plus, quatre cas de troubles neurodéveloppementaux, chacun représentant des odyssées diagnostiques longues et difficiles, ont finalement été résolus.
"Le séquençage à lecture longue est probablement le deuxième meilleur test pour les cas non résolus présentant des variantes convaincantes dans un seul gène ou un phénotype clair", a déclaré Negi. « Il peut servir de test de diagnostic unique, réduisant ainsi le besoin de plusieurs visites cliniques et transformant un parcours de diagnostic de plusieurs années en quelques heures. »
En moyenne, chaque patient possédait 280 gènes (y compris certains gènes de la maladie mendélienne associés à des maladies héréditaires causées par des mutations d'un seul gène) avec des régions codantes pour des protéines importantes qui sont clairement couvertes par des lectures longues et non détectées par des lectures courtes.
"Il y a tellement plus de génome que les longues lectures peuvent débloquer", a déclaré Negi. "Mais il faudra du temps avant que nous puissions interpréter pleinement ces nouvelles informations révélées par de longues lectures. Ces données n'étaient pas présentes dans nos bases de données cliniques. Les lectures révèlent environ 5,8 % de plus du génome télomère à télomère auquel les lectures courtes ne pouvaient tout simplement pas accéder."
Parmi les autres chercheurs de l'UC Santa Cruz impliqués dans cette recherche figurent Brandy McNulty, Ivo Violich, Joshua Gardner, Todd Hillaker et Sara O'Rourke.
Cette recherche a été financée en partie par l’Initiative Chan Zuckerberg.
Sources :
Negi, S., et coll. (2025) Faire progresser l’assemblage du génome des nanopores à lecture longue et une variante précise appelant à la détection des maladies rares. Le Journal américain de génétique humaine. doi.org/10.10doi.org/10.1016/j.ajhg.2025.01.00216/j.ajhg.2025.01.002.