科学家正在利用人工智能构建针对 SARS-CoV-2 的防突变抗体

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

科学家们利用人工智能创建了抗突变抗体,其性能优于传统药物设计,并提供了一种强大的新工具来对抗 SARS-CoV-2 等快速进化的病毒。在最近发表在《科学报告》杂志上的一项研究中,研究人员测试并使用了多项尖端技术,包括机器学习、蛋白质结构建模、自然语言处理和蛋白质序列语言建模,设计出能够中和 1,300 多种 SARS-COV-2 毒株(包括突变株)的抗体。该设计包括刺突蛋白 (RBD) 受体结合域的 64 个关键突变,并重点关注病毒进入的这一关键区域。使用的抗体模板是 CR3022、casiirivimab (Regen 10,933) 和 imdevimab (Regen 10,987),...

科学家正在利用人工智能构建针对 SARS-CoV-2 的防突变抗体

科学家们利用人工智能创建了抗突变抗体,其性能优于传统药物设计,并提供了一种强大的新工具来对抗 SARS-CoV-2 等快速进化的病毒。

在最近发表在该杂志上的一项研究中科学报告研究人员测试并使用了多项尖端技术,包括机器学习、蛋白质结构建模、自然语言处理和蛋白质序列语言建模,设计出可以中和 1300 多种 SARS-COV-2 毒株(包括突变株)的抗体。该设计包括刺突蛋白 (RBD) 受体结合域的 64 个关键突变,并重点关注病毒进入的这一关键区域。使用的抗体模板是CR3022、casiirivimab (Regen 10,933)和imdevimab (Regen 10,987),它们是已知的针对冠状病毒的单克隆抗体。

研究结果显示,新抗体与 SARS-CoV-2 毒株之间具有很强的反应性,包括 Delta(10 种抗体)和 Omicron(1 种抗体)。值得注意的是,第一批抗体中的 14% 和第二批抗体中的 40% 显示出“三重交叉结合”,这意味着它们在 ELISA 测定中与野生型、Delta 和 Omicron 菌株的受体结合域 (RBD) 结合。特别是,目前的方法被证明比传统的基于结构的方法更耗时且更具成本效益。它可以彻底改变未来的药物设计和开发,特别是对于快速进化的病原体,这些病原体需要频繁修改以适应其快速突变率。虽然该研究通过第二轮抗体设计来应对 Omicron 的出现,证明了其适应性,但其对全新和未知的未来变异的预测能力仍然是推测性的,尚未得到直接证明。

背景

导致 COVID-19 大流行的严重急性呼吸综合征冠状病毒 2 (SARS-CoV-2) 仍然是人类历史上最严重的大流行之一,自 2019 年底发现以来,已夺去了超过 700 万人的生命。幸运的是,政府实施的社会疏远措施,加上广泛的抗 COVID-19 免疫干预措施,大大遏制了疾病的传播。

不幸的是,SARS-COV-2 是一个快速进化的病毒家族,现在已经出现了对先前批准的抗体疗法具有耐药性的新毒株。一个典型的例子是菌株 b.1.427 和 b.1.429 由于 L452R 取代而对 bamlanivimab 和 etesevimab 表现出耐药性。

虽然正在进行的研究竞赛正在调查新型、耐药性日益增强的 SARS-CoV-2 毒株的起源,但传统的抗体发现方法是劳动密集型、低效且昂贵的。通过利用图形神经网络 (GNN) 和基于语音的网络(自然语言处理架构)等人工智能 (AI) 模型的最新计算和技术进步,研究人员可以比以往更快、更高效地进行设计和筛选。

关于该研究

本研究旨在评估基于人工智能的抗体-抗原结合建模方法和筛选具有广谱中性能力的抗体的可行性。它展示了人工智能模型在快速发现治疗方法以应对未来流行病的应用,并突显了其在医学领域的潜力。

“我们的研究描述了使用深度学习模型来计算设计针对不同病毒株的刺突蛋白的有效且广谱的突变,随后的湿实验室实验证实了这一结果。”

该研究开发了几个内部“抗体亲和力成熟人工智能模型”。这些模型基于 GNN 和基于语音的网络架构。 GNN 架构特别能够将氨基酸残基之间的关系建模为图表,并捕获与抗体-抗原结合相关的局部和全局序列特征。所有模型均使用来自四个精选数据集的数据集进行训练:1. Skempi 数据库、2. 观察到的抗体空间、3. 抗体结合数据库 (AB-Bind) 和 4. UniProt。

训练后,使用 Skempi 和 AB-Bind 数据库的组合数据集评估模型的准确性和性能。使用 Leave-5-Out (L5O) 方法评估准确性和可扩展性。

通过首先整理 GISAID 数据库数据(1300 个 SARS-COV-2 毒株)、在计算机交叉结合抗体测定中选择模板并在计算机中生成突变体库(模板中的突变)来鉴定 CoVID-19 中和抗体。然后使用机器学习模型来发现与交付的 1,300 种 SARS-CoV-2 毒株中的几种具有广谱结合的抗体。由于 S1 蛋白对于抗原抗体结合至关重要,因此鉴定出了对病毒 S1 蛋白突变具有抵抗力的抗体。

随后进行了湿实验室测定(酶联免疫吸附测定 [ELISA] 和冠状病毒细胞毒性测定)以验证计算结果。 Omicron 出现后,研究人员进行了第二轮计算抗体设计,以提高专门针对 Omicron 的抗体亲和力,证明了他们的方法对新兴变体的反应适应性。

SARS-COV-2 交叉结合序列选择和病毒突变数据管理。步骤 2:基于 AI 的抗体结合预测和跨变体结合选择,以选择未来变体的潜在候选序列。步骤3:使用基于ELISA的测定法测量抗体的结合能力;并使用中和和细胞病变效应测定(CPE)测量抗体的中和能力。

研究结果

模型准确性评估(使用 Spearman 排名系数进行)显示,基于图的模型优于基于语言的方法。值得注意的是,基于图形和语言的模型都匹配或超过了当前商业(非机器学习)基于结构的方法 Discovery Studio。

“与 Discovery Studio 使用源自一级、二级和三级蛋白质结构的物理模型来计算结合亲和力不同,我们的模型从大量实验数据中学习抗体序列和结合亲和力之间的映射。”

神经网络结果的优势进一步扩展,基于图形的模型 (Pearson = 0.6) 优于最传统的计算机方法 (Discovery Studio Pearson = 0.45)。

湿实验室实验证实了这些结果。合成了人工智能设计的具有最高预测结合能力的抗体序列。令人鼓舞的是,观察到大多数这些抗体在 B.1、Delta 和 Omicron SARS-CoV-2 毒株上以较高浓度结合并经常达到过饱和状态。

冠状病毒细胞病变检测显示,10 种抗体能够中和感染 Delta 菌株的 Vero-E6 宿主细胞,一种抗体能够中和感染 Omicron 菌株的细胞。然而,研究还发现,ELISA 测定中的强结合并不总是与基于细胞的测定中的中和能力相对应,表明仅结合亲和力并不能保证中和。这种差异可能是由于与活病毒相比,板中刺突蛋白的结构 (ELISA) 以及特定表位位置和抗体构象存在差异。

值得注意的是,虽然这些结果很有希望,但该研究仅限于体外实验。尚未进行体内(动物或人类)功效研究,需要进一步研究,例如表位作图和构象动力学研究,以实现更精确的抗体设计和验证。

虽然该研究的重点是实现广泛的中和,但作者承认,广泛的交叉反应性和治疗特异性之间可能存在权衡,这可能会限制在某些临床背景下的实用性。

结论

本研究强调了使用人工智能无结构深度神经网络来发现和筛选治疗抗体的好处。这些计算模型在成本、效率和准确性方面显着优于传统的基于结构的非机器学习结构平台。人工智能模型还有一个额外的优势,即迭代改进最初发现的抗体,以补偿快速进化的病原体中的突变。

“因为我们的方法以低计算成本结合了灵活性和高吞吐量,这也可能有利于该技术的其他应用。”


资料来源:

Journal reference: