作者 | 百度研究院
编辑 | 刘燕
疫情期间,mRNA疫苗以更高的安全性和有效性,更快的研发和生产速度被寄予厚望,成为疫情防控的重要武器,也是各国生命科学领域的关键竞争点。
虽然目前 mRNA 技术已被成功商业化,但全球的科研团队仍面临一个统一难题:mRNA 疫苗普遍稳定性低,致使它非常“脆弱”,很容易因为降解而失效,这成为 mRNA 疫苗研发过程中的巨大阻碍。
mRNA 的这种不稳定性给 mRNA 疫苗的存储、运输和免疫原性都带来了挑战,这些问题的解决与 mRNA 疫苗序列的设计息息相关。目前业内普遍认可的破解之道,就是设计出具有稳定结构且蛋白质翻译效率高的 mRNA 序列。
虽然找到了解决路径,但是要想破局并不容易。序列设计所需要的庞大的计算量,成为研发过程中最严峻的“拦路虎”。与新冠病毒刺突蛋白对应的 mRNA,若采用最传统的遍历方法去寻找一条稳定的序列,需要查看 10^632 次方个 mRNA 序列。
打个比方,假设一台超级计算机每秒计算一个序列,在宇宙诞生到现在的 138 亿年时间里,可能连潜在序列亿万分之一都无法搜索完成。
面对如此庞大的搜索空间,必须要有全新的算法,才能在有限的时间内寻找到那条最稳定有效的疫苗序列。
早在 2018 年,百度研究院就开展了 RNA 二级结构领域的研究。得益于这几年在生物计算领域的研究积累,在疫情之初,百度研究院做到了快速响应,并在 2020 年 4 月正式对外发布了LinearDesign mRNA序列优化算法。
与依靠穷举法搜索稳定 mRNA 序列的思路不同,LinearDesign 通过动态规划算法,将序列稳定性和蛋白质翻译效率指标进行联合优化,可在 10 分钟内找到比天然序列更加稳定且蛋白质表达水平更高的新冠 mRNA 疫苗序列,实现了在最短时间内用最高的效率得出最优化的方案。
为了进一步验证 LinearDesign 算法的实际有效性,百度联合 mRNA 药物公司斯微生物进行了一系列实验研究。
本次实验研究基于 LinearDesign 算法设计的七条编码新冠病毒刺突蛋白的 mRNA 疫苗序列,对这些 mRNA 分子的稳定性、编码蛋白表达水平以及动物免疫原性等方面开展了深入研究,并与用传统方法设计的基准 mRNA 序列进行了头对头的对比。
近日,百度和斯微生物联合公布了 mRNA 疫苗序列设计算法 LinearDesign 的新冠病毒疫苗生物实验结果: 在稳定性、蛋白质表达水平以及免疫原性等多个衡量疫苗的重要指标上,LinearDesign 设计的新冠疫苗序列均大幅优于传统方法设计的基准序列,尤其在抗原中和抗体滴度这一衡量疫苗有效性的关键指标上,LinearDesign 设计的序列最高超过基准序列达到 20 倍,表示 LinearDesign 设计的疫苗能够有效产生免疫保护;其实际有效性和应用于生物制药领域的价值被充分验证。
百度 LinearDesign 算法设计的七条疫苗序列(A-G)以及基准序列(H)等相关信息
百度 LinearDesign 算法从理论层面和生物学实验层面得到有效性验证,为将 AI 应用于生命科学探索出一条实际可行的道路。
LinearDesign 算法也进一步验证了AI+制药的价值。这项技术还具有广泛的适用性,除了应用于新冠病毒 mRNA 疫苗的研发,还能包括传染病疫苗、肿瘤疫苗、单抗等各种疫苗和药物的研发,也进一步验证了人工智能、生物计算技术在生命科学领域的实际应用价值。
以 LinearDesign 算法为代表的生物计算技术,将大大缩短新药研发的周期、降低研发成本,并能提高医疗诊断的准确性和效率。
公众号推荐:
跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。
评论 4 条评论