最后读取测序正在彻底改变罕见疾病的诊断
全世界有十分之一的人患有一种罕见的遗传性疾病,但尽管基因技术和检测迅速发展,但其中约 50% 的人仍未得到诊断。即使一个人能够接受检测,诊断过程也可能需要大约五年或更长时间,有时对于通常是儿童的患者来说,开始适当的治疗已经太晚了。部分原因是当前的临床测试使用一种称为短读长测序的方法,该方法无法访问基因组某些区域的信息,因此无法为诊断提供关键证据......
最后读取测序正在彻底改变罕见疾病的诊断
全世界有十分之一的人患有一种罕见的遗传性疾病,但尽管基因技术和检测迅速发展,但其中约 50% 的人仍未得到诊断。即使一个人能够接受检测,诊断过程也可能需要大约五年或更长时间,有时对于通常是儿童的患者来说,开始适当的治疗已经太晚了。
部分原因是当前的临床测试使用一种称为短读长测序的方法,该方法无法访问基因组某些区域的信息,因此无法提供诊断的关键证据。然而,加州大学圣克鲁斯分校的研究人员正在开发一种名为 Lonad 测序的尖端替代方法,该方法可以提供更全面的数据集来识别变异,消除对多种专门测试的需要,并优化罕见疾病的诊断。
一项新的研究表明,长寿命测序有可能提高诊断率,同时将诊断时间从数年缩短到数天——只需一次测试即可,而且成本要低得多。该研究发表于美国人类遗传学杂志核心成员为UCSC基因组研究所生物分子工程教授Benedikt Paten和副教授Karen Miga,以及前UCSC博士后学者Jean Monlong。
罕见疾病是人们多年来一直与之斗争的疾病,如果我们拥有优化诊断测试的测序技术,那将是一个巨大的贡献——这就是我们在本文中测试的内容。 “
Shloka Negi,加州大学圣克鲁斯分校医学学士博士学生,论文第一作者
“如今,基因测序的诊断率低得令人沮丧,”帕滕说。 “一个可能的原因是我们队列中的测序方法、变异和表观遗传信号不完整。
寻找罕见疾病
这项研究的重点是由单基因紊乱引起的罕见单基因疾病。
科学家通过搜索遗传物质来寻找变异来诊断遗传疾病,变异是基因中可能阻止其正常运作的差异。寻找这些变异的典型方法是使用一种称为短读长测序的技术,该技术将基因碱基对(腺嘌呤 (A)、胞嘧啶 (C)、鸟嘌呤 (G) 和胸腺嘧啶 (T) 的组合)绘制成每个约 150-250 个的序列。
然而,短读长测序的局限性在于它可能会遗漏基因组某些区域的关键信息,例如远远超过 250 个碱基对的碱基对模式。它也不能执行“定相”,即确定哪些变异是从母亲遗传的,哪些来自父亲的过程。这可以帮助临床医生发现哪些变异是遗传性的。例如,当两个变体遗传自同一亲本、每个亲本各一个或根本不遗传时。这对于基因诊断来说可能是非常有用的信息,特别是当父母数据不可用时。
相比之下,长寿命测序可以同时读取较长的 DNA 片段,从而消除可能导致科学家和临床医生错过有关基因变异的重要信息的间隙。长读长测序还提供直接相位数据以及有关甲基化的信息,甲基化是 DNA 中的一种化学过程,导致基因“打开或关闭”并可能导致疾病。
“在某些情况下,长寿命测序会更好,我们正在采取措施证明这一点,”内吉说。
引入方法
加州大学圣克鲁斯分校基因组研究所的研究人员在长寿命测序方面拥有丰富的创新历史和专业知识,并正在积极开发方法来优化各种健康研究应用的测序和分析。研究人员为取得成就而开发的许多技术,例如第一个真正完整的“端粒-端粒”参考基因组,现在正被用来改善患者的治疗结果。
MIGA 表示:“如果之前的发现得到证实,我们发现,通过使用完整的、所谓的‘端粒-端粒’参考基因组,而不是现有的不完整但广泛使用的基因组参考,使用长寿命测序的好处会显着增加。” “我们预计泛基因组——代表不同人类变异的参考文献——将从新的长寿命测序技术中受益更多。”
Paten 和 Miga 的实验室与临床医生合作,研究了 42 名罕见疾病患者的病例——其中一些患者是通过短读方法或其他专门测试诊断出来的,其中一些患者尚未得到诊断。在某些情况下,研究人员可以获得父母的遗传信息,但在其他情况下却无法获得。
MIGA 实验室使用纳米孔测序(UCSC 的一种长寿命测序方法)对患者进行了长寿命测序,以实现患者基因组的高度准确的端到端读取,每个样本的费用约为 1,000 美元。
使用 Paten 实验室开发的计算方法对基因组数据进行分析,以查找小型和大型变异、阶段数据和甲基化数据,所有这些都使用称为 NAPU 管道的管道。分析过程大约需要一天或更短的时间,具体取决于计算机处理的速度,费用为 100 美元。
破案
在对患者数据进行测序和分析后,研究人员发现,与使用短读长测序得出的数据相比,长读长读数提供了更全面的数据集。
长读长测序为该队列中 42 名患者中的 11 名提供了结论性诊断,提供了短读长数据以及其他信息的所有信息,包括其他罕见的候选变异、长程定相和甲基化 - 所有这些都通过一个单一、廉价且快速的方案进行。
确诊的 11 例患者中,有 4 例患有先天性肾上腺发育不全(肾上腺增大且功能不正常的罕见病症)。导致这种疾病的基因位于基因组中一个特别具有挑战性的区域——它无法使用短读长测序技术进行表征,而且目前的临床测试既繁琐又不完整。
“为了解决这些情况,我们开发了一种新的泛基因组工具,集成了新的高质量组件,例如法国 INSERM 目前的参考基因组“端粒-端粒”。“我们很高兴看到人类基因组,这在历史上一直很难研究。我们的结果鼓励我们将治疗方法扩展到更多长期停滞不前的疾病。”
此外,两例涉及性发育障碍,而罕见的睾丸间质细胞发育不全导致睾丸间质细胞发育不全,影响男性性发育。此外,四例神经发育障碍病例最终得到解决,每例都代表着漫长而富有挑战性的诊断过程。
Negi 说:“长读长测序可能是针对单个基因中具有引人注目的变异或明确表型的未解决病例的下一个最佳测试。” “它可以作为单一的诊断测试,减少多次临床就诊的需要,并将长达数年的诊断过程缩短为几个小时。”
平均而言,每个患者有280个基因(包括一些与单基因突变引起的遗传性疾病相关的孟德尔病基因),这些基因具有重要的蛋白质编码区,这些区域被长读段清楚地覆盖,而被短读段检测不到。
“长读可以解锁更多的基因组,”内吉说。 “但我们需要时间才能完全解释长读取所揭示的新信息。这些数据不存在于我们的临床数据库中。读取揭示了短读取根本无法访问的大约 5.8% 的端粒到端粒基因组。”
参与这项研究的其他加州大学圣克鲁斯分校研究人员包括 Brandy McNulty、Ivo Violich、Joshua Gardner、Todd Hillaker 和 Sara O’Rourke。
这项研究的部分资金来自陈·扎克伯格倡议。
资料来源:
内吉,S., 等人。 (2025) 推进长读长纳米孔基因组组装和准确的变异调用以实现罕见疾病检测。 美国人类遗传学杂志。 doi.org/10.10doi.org/10.1016/j.ajhg.2025.01.00216/j.ajhg.2025.01.002 。