La secuenciación de última lectura está revolucionando el diagnóstico de enfermedades raras
Una de cada 10 personas en todo el mundo se ve afectada por un trastorno genético raro, pero alrededor del 50% de ellas siguen sin ser diagnosticadas a pesar de los rápidos aumentos en la tecnología y las pruebas genéticas. Incluso si una persona tiene acceso a las pruebas, el proceso de diagnóstico puede tardar alrededor de cinco años o más, lo que a veces es demasiado tarde para que los pacientes, que a menudo son niños, comiencen el tratamiento adecuado. Esto se debe en parte a que las pruebas clínicas actuales utilizan un método llamado secuenciación de lectura corta, que no puede acceder a información en ciertas regiones del genoma y, por lo tanto, proporciona evidencia crucial para el diagnóstico...
La secuenciación de última lectura está revolucionando el diagnóstico de enfermedades raras
Una de cada 10 personas en todo el mundo se ve afectada por un trastorno genético raro, pero alrededor del 50% de ellas siguen sin ser diagnosticadas a pesar de los rápidos aumentos en la tecnología y las pruebas genéticas. Incluso si una persona tiene acceso a las pruebas, el proceso de diagnóstico puede tardar alrededor de cinco años o más, lo que a veces es demasiado tarde para que los pacientes, que a menudo son niños, comiencen el tratamiento adecuado.
Esto se debe en parte a que las pruebas clínicas actuales utilizan un método llamado secuenciación de lectura corta, que no puede acceder a información en ciertas regiones del genoma y, por lo tanto, no puede generar evidencia crucial para el diagnóstico. Sin embargo, los investigadores de UC Santa Cruz están avanzando hacia un método alternativo de vanguardia, llamado secuenciación Lonad, que puede proporcionar un conjunto de datos más completo para identificar variaciones, eliminar la necesidad de múltiples pruebas especializadas y optimizar el diagnóstico de enfermedades raras.
Un nuevo estudio muestra que la secuenciación de larga duración tiene el potencial de mejorar las tasas de diagnóstico y al mismo tiempo reducir el tiempo hasta el diagnóstico de años a días, en una sola prueba y a un costo mucho menor. El estudio fue publicado enLa revista americana de genética humanay dirigido por miembros principales del Profesor de Ingeniería Biomolecular BME del Instituto Genómico de la UCSC Benedikt Paten y la Profesora Asociada de BME Karen Miga, así como por el ex académico postdoctoral de la UCSC Jean Monlong.
Las enfermedades raras son algo con lo que la gente ha luchado durante muchos años, y si contamos con tecnología de secuenciación que optimice las pruebas de diagnóstico, eso será una gran contribución, y eso es lo que probamos como parte de este documento. “
Shloka Negi, UC Santa Cruz Bme Ph.D. estudiante, primer autor del artículo
"Hoy en día, el rendimiento diagnóstico de la secuenciación genética es frustrantemente bajo", afirmó Paten. “Una causa probable son los métodos de secuenciación incompletos, las variantes y las señales epigenéticas en nuestra cohorte.
Encuentra enfermedades raras
Este estudio se centró en enfermedades monogénicas raras causadas por un trastorno de un solo gen.
Los científicos diagnostican enfermedades genéticas buscando en su material genético variantes: diferencias en un gen que pueden impedir que funcione correctamente. El enfoque típico para encontrar estas variantes utiliza una técnica llamada secuenciación de lectura corta, que mapea pares de bases genéticas (combinaciones de adenina (A), citosina (C), guanina (G) y timina (T), en secuencias de aproximadamente 150 a 250 cada una.
Sin embargo, la limitación de la secuenciación de lectura corta es que puede perder información crucial en ciertas regiones del genoma, como patrones de pares de bases que son mucho más largos que solo 250 pares de bases. Tampoco puede realizar “fases”, el proceso de determinar qué variantes se heredan de la madre y cuáles provienen del padre. Esto puede ayudar a los médicos a descubrir qué variantes se heredan. Por ejemplo, cuando dos variantes se heredan del mismo padre, una de cada padre, o no se heredan en absoluto. Esta puede ser información muy útil para diagnósticos genéticos, especialmente cuando los datos de los padres no están disponibles.
Por el contrario, la secuenciación de larga duración puede leer largos tramos de ADN simultáneamente, eliminando lagunas que pueden hacer que los científicos y médicos pierdan información importante sobre la variación genética. La secuenciación de lectura larga también proporciona datos directos de fase, así como información sobre la metilación, un proceso químico en el ADN que hace que los genes se "activan o desactivan" y puede contribuir a la enfermedad.
"La secuenciación de larga duración será mucho mejor en ciertos casos, y estamos tomando medidas para demostrarlo", dijo Negi.
Liderar los métodos
Los investigadores del Instituto de Genómica de UC Santa Cruz tienen una amplia historia de innovación y experiencia en secuenciación de larga duración y están desarrollando activamente métodos para optimizar la secuenciación y el análisis para una amplia gama de aplicaciones de investigación en salud. Muchas de las técnicas que los investigadores desarrollaron para lograr logros, como el primer genoma de referencia “telómero-telómero” verdaderamente completo, se están utilizando ahora para mejorar los resultados de los pacientes.
"Si se reforzaran los hallazgos anteriores, descubrimos que los beneficios del uso de secuenciación de larga duración aumentaron significativamente al utilizar un genoma de referencia completo, el llamado 'telómero-telómero', en lugar de la referencia genómica incompleta pero ampliamente utilizada existente", dijo MIGA. "Anticipamos que los pangenomas (referencias que representan variaciones humanas diversas) se beneficiarán aún más de las nuevas tecnologías de secuenciación de larga duración".
Los laboratorios de Paten y Miga se asociaron con médicos para trabajar en casos de 42 pacientes con enfermedades raras, algunos de los cuales fueron diagnosticados mediante métodos de lectura breve u otras pruebas especializadas, y otros aún no fueron diagnosticados. En algunos casos, los investigadores tuvieron acceso a la información genética de los padres, pero en otros no.
El laboratorio MIGA realizó la secuenciación de larga duración de los pacientes utilizando la secuenciación Nanopore, un método de secuenciación de larga duración en la UCSC, para lograr lecturas altamente precisas de extremo a extremo de los genomas de los pacientes por aproximadamente $ 1,000 por muestra.
Los datos genómicos se analizaron utilizando métodos computacionales desarrollados en el laboratorio de Paten para encontrar variantes pequeñas y grandes, datos de fase y datos de metilación, todo utilizando un canal llamado canal NAPU. El proceso de análisis dura aproximadamente un día o menos, dependiendo de la velocidad de procesamiento de la computadora, y cuesta 100 dólares.
resolver casos
Después de secuenciar y analizar los datos de los pacientes, los investigadores descubrieron que las lecturas de lectura larga proporcionaban un conjunto de datos más completo en comparación con lo que se puede obtener mediante la secuenciación de lectura corta.
La secuenciación de lectura larga proporcionó un diagnóstico concluyente para 11 de los 42 pacientes de la cohorte, proporcionando todo, desde los datos de lectura corta, así como información adicional que incluye variantes candidatas raras adicionales, fases de largo alcance y metilación, todo en un protocolo único, económico y rápido.
Los 11 casos diagnosticados incluyeron cuatro hipoplasias suprarrenales congénitas (una afección rara en la que las glándulas suprarrenales aumentan de tamaño y no funcionan correctamente). El gen responsable de esta enfermedad está ubicado en una región del genoma particularmente desafiante: no se puede caracterizar mediante tecnología de secuenciación de lectura corta y las pruebas clínicas actuales son engorrosas e incompletas.
"Para resolver estos casos, hemos desarrollado una nueva herramienta pangenómica que integra nuevos ensamblajes de alta calidad, como el genoma de referencia "telómeros-telómeros" que se encuentra actualmente en el INSERM en Francia. "Estábamos entusiasmados de ver el genoma humano, que históricamente ha sido difícil de estudiar. Nuestros resultados nos alientan a ampliar nuestro enfoque a más enfermedades que han estado estancadas durante mucho tiempo".
Además, dos casos implicaron trastornos del desarrollo sexual, mientras que un caso raro de hipoplasia de células de Leydig debido a células de Leydig subdesarrolladas en los testículos afectó el desarrollo sexual masculino. Además, finalmente se han resuelto cuatro casos de trastornos del desarrollo neurológico, cada uno de los cuales representa largas y desafiantes odiseas de diagnóstico.
"La secuenciación de lectura larga es probablemente la mejor prueba para casos no resueltos con variantes convincentes en un solo gen o un fenotipo claro", dijo Negi. "Puede servir como una prueba de diagnóstico única, reduciendo la necesidad de múltiples visitas clínicas y convirtiendo un viaje de diagnóstico de años en cuestión de horas".
En promedio, cada paciente tenía 280 genes (incluidos algunos genes de la enfermedad mendeliana asociados con enfermedades hereditarias causadas por mutaciones de un solo gen) con importantes regiones codificantes de proteínas que están claramente cubiertas por lecturas largas y no detectadas por lecturas cortas.
"Hay mucho más genoma que las lecturas largas pueden desbloquear", dijo Negi. "Pero pasará tiempo antes de que podamos interpretar completamente esta nueva información revelada por lecturas largas. Estos datos no estaban presentes en nuestras bases de datos clínicas. Las lecturas descubren alrededor de un 5,8% más del genoma de telómero a telómero al que las lecturas cortas simplemente no pudieron acceder".
Otros investigadores de UC Santa Cruz involucrados en esta investigación incluyen a Brandy McNulty, Ivo Violich, Joshua Gardner, Todd Hillaker y Sara O'Rourke.
Esta investigación fue financiada en parte por la Iniciativa Chan Zuckerberg.
Fuentes:
Negi, S., et al. (2025) Avances en el ensamblaje del genoma de nanoporos de lectura larga y una variante precisa que exige la detección de enfermedades raras. La Revista Estadounidense de Genética Humana. doi.org/10.10doi.org/10.1016/j.ajhg.2025.01.00216/j.ajhg.2025.01.002.