最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

超算上百亿年找不到的答案,百度这个算法十分钟内找到了最优解

  • 2021-10-14
  • 本文字数:1305 字

    阅读完需:约 4 分钟

超算上百亿年找不到的答案,百度这个算法十分钟内找到了最优解

作者 | 百度研究院

编辑 | 刘燕


疫情期间,mRNA疫苗以更高的安全性和有效性,更快的研发和生产速度被寄予厚望,成为疫情防控的重要武器,也是各国生命科学领域的关键竞争点。


虽然目前 mRNA 技术已被成功商业化,但全球的科研团队仍面临一个统一难题:mRNA 疫苗普遍稳定性低,致使它非常“脆弱”,很容易因为降解而失效,这成为 mRNA 疫苗研发过程中的巨大阻碍。


mRNA 的这种不稳定性给 mRNA 疫苗的存储、运输和免疫原性都带来了挑战,这些问题的解决与 mRNA 疫苗序列的设计息息相关。目前业内普遍认可的破解之道,就是设计出具有稳定结构且蛋白质翻译效率高的 mRNA 序列。


虽然找到了解决路径,但是要想破局并不容易。序列设计所需要的庞大的计算量,成为研发过程中最严峻的“拦路虎”。与新冠病毒刺突蛋白对应的 mRNA,若采用最传统的遍历方法去寻找一条稳定的序列,需要查看 10^632 次方个 mRNA 序列。


打个比方,假设一台超级计算机每秒计算一个序列,在宇宙诞生到现在的 138 亿年时间里,可能连潜在序列亿万分之一都无法搜索完成。


面对如此庞大的搜索空间,必须要有全新的算法,才能在有限的时间内寻找到那条最稳定有效的疫苗序列。


早在 2018 年,百度研究院就开展了 RNA 二级结构领域的研究。得益于这几年在生物计算领域的研究积累,在疫情之初,百度研究院做到了快速响应,并在 2020 年 4 月正式对外发布了LinearDesign mRNA序列优化算法


与依靠穷举法搜索稳定 mRNA 序列的思路不同,LinearDesign 通过动态规划算法,将序列稳定性和蛋白质翻译效率指标进行联合优化,可在 10 分钟内找到比天然序列更加稳定且蛋白质表达水平更高的新冠 mRNA 疫苗序列,实现了在最短时间内用最高的效率得出最优化的方案。


为了进一步验证 LinearDesign 算法的实际有效性,百度联合 mRNA 药物公司斯微生物进行了一系列实验研究。


本次实验研究基于 LinearDesign 算法设计的七条编码新冠病毒刺突蛋白的 mRNA 疫苗序列,对这些 mRNA 分子的稳定性、编码蛋白表达水平以及动物免疫原性等方面开展了深入研究,并与用传统方法设计的基准 mRNA 序列进行了头对头的对比。


近日,百度和斯微生物联合公布了 mRNA 疫苗序列设计算法 LinearDesign 的新冠病毒疫苗生物实验结果: 在稳定性、蛋白质表达水平以及免疫原性等多个衡量疫苗的重要指标上,LinearDesign 设计的新冠疫苗序列均大幅优于传统方法设计的基准序列,尤其在抗原中和抗体滴度这一衡量疫苗有效性的关键指标上,LinearDesign 设计的序列最高超过基准序列达到 20 倍,表示 LinearDesign 设计的疫苗能够有效产生免疫保护;其实际有效性和应用于生物制药领域的价值被充分验证。



百度 LinearDesign 算法设计的七条疫苗序列(A-G)以及基准序列(H)等相关信息


百度 LinearDesign 算法从理论层面和生物学实验层面得到有效性验证,为将 AI 应用于生命科学探索出一条实际可行的道路。


LinearDesign 算法也进一步验证了AI+制药的价值。这项技术还具有广泛的适用性,除了应用于新冠病毒 mRNA 疫苗的研发,还能包括传染病疫苗、肿瘤疫苗、单抗等各种疫苗和药物的研发,也进一步验证了人工智能、生物计算技术在生命科学领域的实际应用价值。


以 LinearDesign 算法为代表的生物计算技术,将大大缩短新药研发的周期、降低研发成本,并能提高医疗诊断的准确性和效率。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-10-14 14:463848
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.2 次阅读, 收获喜欢 1966 次。

关注

评论 4 条评论

发布
用户头像
1232311
2021-10-15 11:52
回复
d d d d s s s
2021-10-15 11:59
回复
sdasd
2021-10-15 11:59
回复
asdas
2021-10-15 11:59
回复
没有更多了
发现更多内容

SD-WAN对云服务的影响

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

SD-WAN网络中,CPE设备的重要性与选择

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

小红书笔记详情API入门指南

技术冰糖葫芦

API 文档

超越传统模式:商品企划系统如何助力鞋服品牌创新突围?

第七在线

文心一言 VS 讯飞星火 VS chatgpt (204)-- 算法导论15.3 3题

福大大架构师每日一题

福大大架构师每日一题

检测LED单元板的好坏的方法

Dylan

LED display LED显示屏 led显示屏厂家

使用ConfuserEx代码混淆工具保护你的.NET应用程序

EquatorCoco

.net 开源 应用程序 混淆

长期有效!开放原子基金会联合龙蜥社区推出的「人人都可以参与开源」学习赛上线

OpenAnolis小助手

开源 操作系统 龙蜥社区 开放原子 人人都可以参与开源

合合信息入选上海市网信办“2023年度网络数据安全风险评估试点工作优秀单位”

合合技术团队

安全 数据安全 合合信息

掌握 Docker PS 命令:轻松管理容器

霍格沃兹测试开发学社

深度解析:Allure报告如何提升你的测试效率?

测试人

软件测试 自动化测试 测试开发

MCtalk·CEO对话×影刀RPA丨不确定的周期,越要找到确定的竞争优势

ToB行业头条

百度营销发布「生成商业新未来」特刊

科技热闻

轻松实现UniApp Xcode上传IPA无需Mac,appuploder一键上传助你高效开发!

深入理解 Docker Run 命令:从入门到精通

霍格沃兹测试开发学社

2024年金三银四Java初中高级面试1000问,覆盖一线大厂各种面试痛点

采菊东篱下

编程 程序员 java面试

国际盛会 | 蔚蓝创造亮相KEY ENERGY 2024能源展

科技热闻

Java面向对象之内部类的几类使用场景

快乐非自愿限量之名

Java 面向对象 开发语言 面向编程

从 0 开始构建知识图谱的 5 个启动建议

悦数图数据库

知识图谱

深入探析:云计算与边缘计算在软件开发中的应用与挑战

EquatorCoco

云计算 低代码 边缘计算 项目开发

面试官:说说volatile底层实现原理?

王磊

Java 面试

数据中台与低代码:数字中国战略的关键技术

不在线第一只蜗牛

数据中台 低代码 开发语言 数字转型

任务系统之API子任务

快乐非自愿限量之名

接口 API 项目开发 任务系统

SD-WAN技术:是挑战还是机遇?

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

云原生与低代码:重塑软件开发新生态

快乐非自愿限量之名

云计算 云原生 软件开发 低代码

杭州悦数受邀参加《大模型驱动的智能知识图谱》标准首次专家研讨会

悦数图数据库

集成专栏丨解析WSDL自动生成API

inBuilder低代码平台

开源 低代码 集成 连接器

利用观测云实现 Kubernetes 多集群可观测

观测云

k8s

电商卖家如何利用API获取用户行为数据

技术冰糖葫芦

API 文档 API 策略

NFT矩阵公排合约系统开发

l8l259l3365

跳槽必看MySQL索引:B+树原理揭秘与索引优缺点分析

王中阳Go

数据库 面试 金三银四 跳槽

超算上百亿年找不到的答案,百度这个算法十分钟内找到了最优解_AI&大模型_百度研究院_InfoQ精选文章