O sequenciamento da última leitura está revolucionando o diagnóstico de doenças raras
Uma em cada 10 pessoas em todo o mundo é afetada por uma doença genética rara, mas cerca de 50% delas permanecem sem diagnóstico, apesar do rápido aumento da tecnologia genética e dos testes. Mesmo que uma pessoa tenha acesso a testes, o processo de diagnóstico pode demorar cerca de cinco anos ou mais, o que por vezes é demasiado tarde para os pacientes, que muitas vezes são crianças, iniciarem o tratamento adequado. Isto ocorre em parte porque os testes clínicos atuais utilizam um método chamado sequenciamento de leitura curta, que não consegue acessar informações em certas regiões do genoma e, portanto, fornece evidências cruciais para o diagnóstico...
O sequenciamento da última leitura está revolucionando o diagnóstico de doenças raras
Uma em cada 10 pessoas em todo o mundo é afetada por uma doença genética rara, mas cerca de 50% delas permanecem sem diagnóstico, apesar do rápido aumento da tecnologia genética e dos testes. Mesmo que uma pessoa tenha acesso a testes, o processo de diagnóstico pode demorar cerca de cinco anos ou mais, o que por vezes é demasiado tarde para os pacientes, que muitas vezes são crianças, iniciarem o tratamento adequado.
Isto ocorre em parte porque os testes clínicos atuais utilizam um método chamado sequenciamento de leitura curta, que não consegue acessar informações em certas regiões do genoma e, portanto, não pode realizar evidências cruciais para o diagnóstico. No entanto, os investigadores da UC Santa Cruz estão a avançar para um método alternativo de ponta, denominado sequenciação Lonad, que pode fornecer um conjunto de dados mais abrangente para identificar variações, eliminar a necessidade de múltiplos testes especializados e optimizar o diagnóstico de doenças raras.
Um novo estudo mostra que o sequenciamento de longa duração tem o potencial de melhorar as taxas de diagnóstico e, ao mesmo tempo, reduzir o tempo até o diagnóstico de anos para dias – em um único teste e a um custo muito menor. O estudo foi publicado emO Jornal Americano de Genética Humanae liderado pelos membros principais do Professor de Engenharia Biomolecular (BME) do Instituto Genômico da UCSC, Benedikt Paten, e pela Professora Associada do BME, Karen Miga, bem como pelo ex-bolsista de pós-doutorado da UCSC, Jean Monlong.
As doenças raras são algo com que as pessoas têm lutado durante tantos anos, e se tivermos tecnologia de sequenciação que otimize os testes de diagnóstico, isso será um enorme contributo - e foi isso que testámos neste documento. “
Shloka Negi, UC Santa Cruz Bme Ph.D. estudante, primeiro autor do artigo
“Hoje, o rendimento diagnóstico do sequenciamento genético é frustrantemente baixo”, disse Paten. “Uma causa provável são os métodos de sequenciamento incompletos, variantes e sinais epigenéticos em nossa coorte.
Encontre doenças raras
Este estudo concentrou-se em doenças monogênicas raras causadas por um distúrbio de um único gene.
Os cientistas diagnosticam doenças genéticas pesquisando seu material genético em busca de variantes – diferenças em um gene que podem impedi-lo de funcionar adequadamente. A abordagem típica para encontrar essas variantes usa uma técnica chamada sequenciamento de leitura curta, que mapeia pares de bases genéticas – combinações de adenina (A), citosina (C), guanina (G) e timina (T) – em sequências de cerca de 150-250 cada.
No entanto, a limitação do sequenciamento de leitura curta é que ele pode perder informações cruciais em certas regiões do genoma, como padrões de pares de bases que são muito mais longos do que apenas 250 pares de bases. Nem pode realizar o “phasing”, o processo de determinar quais variantes são herdadas da mãe e quais vêm do pai. Isto pode ajudar os médicos a descobrir quais variantes são herdadas. Por exemplo, quando duas variantes são herdadas do mesmo pai, uma de cada pai ou não são herdadas. Esta pode ser uma informação muito útil para diagnósticos genéticos, especialmente quando os dados parentais não estão disponíveis.
Em contraste, o sequenciamento de longa duração pode ler longos trechos de DNA simultaneamente, eliminando lacunas que podem fazer com que cientistas e médicos percam informações importantes sobre a variação genética. O sequenciamento de leitura longa também fornece dados de fase direta, bem como informações sobre a metilação, um processo químico no DNA que faz com que os genes sejam “ligados ou desligados” e pode contribuir para doenças.
“O sequenciamento de longa duração será muito melhor em certos casos e estamos tomando medidas para provar isso”, disse Negi.
Liderar em métodos
Os pesquisadores do UC Santa Cruz Genomics Institute têm um extenso histórico de inovação e experiência em sequenciamento de longa vida e estão desenvolvendo ativamente métodos para otimizar o sequenciamento e a análise para uma ampla gama de aplicações de pesquisa em saúde. Muitas das técnicas que os investigadores desenvolveram para alcançar resultados, como o primeiro genoma de referência “telómero-telómero” verdadeiramente completo, estão agora a ser utilizadas para melhorar os resultados dos pacientes.
"Se as descobertas anteriores foram reforçadas, descobrimos que os benefícios do uso do sequenciamento de longa duração aumentaram significativamente com o uso de um genoma de referência completo, chamado 'telômero-telômero', em vez da referência genômica incompleta, mas amplamente utilizada existente", disse a MIGA. “Prevemos que os pangenomas – referências que representam diversas variações humanas – se beneficiarão ainda mais das novas tecnologias de sequenciamento de longa duração”.
Os laboratórios de Paten e Miga uniram-se a médicos para trabalhar em casos de 42 pacientes com doenças raras – alguns dos quais foram diagnosticados através de métodos de leitura curta ou outros testes especializados, alguns dos quais ainda não foram diagnosticados. Em alguns casos, os investigadores tiveram acesso à informação genética dos pais, mas noutros não.
O sequenciamento de longa duração dos pacientes foi conduzido pelo laboratório MIGA usando o sequenciamento Nanopore, um método de sequenciamento de longa duração da UCSC, para obter leituras ponta a ponta altamente precisas dos genomas dos pacientes por aproximadamente US$ 1.000 por amostra.
Os dados genômicos foram analisados usando métodos computacionais desenvolvidos no laboratório Paten para encontrar variantes pequenas e grandes, dados de fase e dados de metilação, todos usando um pipeline chamado pipeline NAPU. O processo de análise leva cerca de um dia ou menos, dependendo da velocidade de processamento do computador, e custa US$ 100.
resolver casos
Depois de sequenciar e analisar os dados dos pacientes, os pesquisadores descobriram que as leituras de leitura longa forneceram um conjunto de dados mais abrangente em comparação com o que pode ser obtido usando o sequenciamento de leitura curta.
O sequenciamento de leitura longa forneceu um diagnóstico conclusivo para 11 dos 42 pacientes da coorte, fornecendo tudo, desde os dados de leitura curta, bem como informações adicionais, incluindo variantes candidatas raras adicionais, faseamento de longo alcance e metilação - tudo em um protocolo único, barato e rápido.
Os 11 casos diagnosticados incluíram quatro hipoplasias adrenais congênitas (uma condição rara em que as glândulas adrenais estão aumentadas e não funcionam adequadamente). O gene responsável por esta doença está localizado numa região particularmente desafiadora do genoma – não pode ser caracterizado utilizando tecnologia de sequenciação de leitura curta e os testes clínicos atuais são complicados e incompletos.
"Para resolver esses casos, desenvolvemos uma nova ferramenta pan-genômica que integra novos conjuntos de alta qualidade, como o genoma de referência "telômeros-telômeros", posição atual no INSERM na França. "Ficamos entusiasmados ao ver o genoma humano, que tem sido historicamente difícil de estudar. Nossos resultados nos encorajam a expandir nossa abordagem para mais doenças que estão estagnadas há muito tempo”.
Além disso, dois casos envolveram distúrbios do desenvolvimento sexual, enquanto um caso raro de hipoplasia das células de Leydig devido ao subdesenvolvimento das células de Leydig nos testículos afetou o desenvolvimento sexual masculino. Além disso, quatro casos de distúrbios do desenvolvimento neurológico, cada um representando longas e desafiadoras odisseias diagnósticas, foram finalmente resolvidos.
“O sequenciamento de leitura longa é provavelmente o próximo melhor teste para casos não resolvidos com variantes convincentes em um único gene ou um fenótipo claro”, disse Negi. “Ele pode servir como um único teste de diagnóstico, reduzindo a necessidade de múltiplas visitas clínicas e convertendo uma jornada de diagnóstico de anos em questão de horas.”
Em média, cada paciente tinha 280 genes (incluindo alguns genes de doenças mendelianas associados a doenças hereditárias causadas por mutações genéticas únicas) com regiões codificadoras de proteínas significativas que são claramente cobertas por leituras longas e não detectadas por leituras curtas.
“Há muito mais genoma que leituras longas podem desbloquear”, disse Negi. "Mas levará algum tempo até que possamos interpretar completamente esta nova informação revelada por leituras longas. Esses dados não estavam presentes em nossos bancos de dados clínicos. As leituras revelam cerca de 5,8% a mais do genoma de telômero a telômero que leituras curtas simplesmente não conseguiam acessar."
Outros pesquisadores da UC Santa Cruz envolvidos nesta pesquisa incluem Brandy McNulty, Ivo Violich, Joshua Gardner, Todd Hillaker e Sara O’Rourke.
Esta pesquisa foi financiada em parte pela Iniciativa Chan Zuckerberg.
Fontes:
Negi, S., e outros. (2025) Avanço na montagem do genoma de nanoporos de leitura longa e variante precisa que exige detecção de doenças raras. O Jornal Americano de Genética Humana. doi.org/10.10doi.org/10.1016/j.ajhg.2025.01.00216/j.ajhg.2025.01.002.