写点什么

寻找新冠致重症因素,如何通过云计算将分析时间缩短 6 倍?

  • 2020-06-03
  • 本文字数:1385 字

    阅读完需:约 5 分钟

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?

阿里云高性能计算团队协助中山大学使用阿里云高性能计算服务进行生物信息科学计算,在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时,大大提高了工作效率。


国内疫情稍有缓和,但公共科研机构与病毒间的战争从未停止。科研人员与医疗工作者们依然在日以继夜地研究着这名“对手”,追溯它从何而来、如何“作恶”,我们又能如何消灭它。科技早已作为科研人员的后盾,他们背后有无数的计算力在为分析病毒而跳动着。


在这些与病毒持续搏斗的科研机构中,就有中山大学医学院,这也是疫情期间阿里云提供免费算力支持的机构之一。

中大医学院尝试寻找致重症的因素

在国内疫情肆虐之际,中山大学医学院通过与多家医院、疾控中心等合作,计划获取超过千名武汉市新冠患者的核酸样本,以及部分病人的全病程数据,希望通过基因组测序及测序数据分析,阐述冠状病毒的起源、进化和致重症机制。



中山大学医学院施莽老师解释,研究人员主要是从病原体本身、微环境(与病原体共感染的细菌/微生物),及宿主即人类的免疫系统三个方面的角度去寻找引发重症的因素。


中山大学医学院使用宏转录组的方法,期望从中原始样本中挖掘得到所有关键的遗传信息。科学家们通过分析这些遗传信息重现病原体感染、宿主免疫和机体内环境相互作用的动态过程,寻找导致机体重症的关键因素。


只有全面了解了重症因素,才可以在临床上进行重症预警,医生可以及早干预,对症下药;并指导缓解和预防重症的药物研发。


此外,科学家会将分析后的临床信息、病毒信息、基因组信息和实验结果数据汇总,构建新冠感染相关大数据,帮助研究病毒起源,也方便后续研究。

阿里云 EHPC,让数据分析性能提升 25%

在研究过程中,科学家首先需要通过高通量基因测序平台,对原始样本进行测序,获得样本中包括病毒、细菌和宿主的完整遗传信息。但这些信息仅是片段化的信息,需要进一步的生物信息学分析(包括序列的拼接和注释)才能解读采样的时间点病人体内正在发生的重要生命过程。



从基因测序到获得全基因组信息的过程


遗传信息的拼装和比对需要高性能计算进行处理,海量的数据更是需要大规模算力。


本次实验处理的病例超过 1000 人,一般病例至少采集两份数据,单份数据就有 2-3G,部分病例为了采集全病程数据还采样数十次,还要再加上对照组信息。同时,中山大学的科学家还需要下载美国国家生物信息中心 NCBI(National Center for Biotechnology Information)中的约 8000 个样品进行比对,其产生的数据之海量可想而知。


在分秒必争的疫情背景下,云上高性能计算的优势凸显,可加快研究进程。


阿里云帮助中山大学整合了从原始数据到获得最后分析结果的完整计算流程,云服务的弹性能够在短时间内快速交付丰富的算力资源, 通过阿里云高性能计算(EHPC)一键部署超算集群环境,根据需求动态增减集群节点,免去了研究人员们针对服务器的管理和维护,不需要在运维上耗费过多精力,只需专注在研究上。


同时,阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25%以上。


在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时。原本需要 1 年的运算量缩减到了约 2 个月时间,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。


2020-06-03 14:241510

评论

发布
暂无评论
发现更多内容

Java程序员如何高效学习分布式系统设计?

了不起的程序猿

后端 分布式系统 架构师 分布式架构 java面试

SD-WAN组网的四种方案及其差异

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商 SDWAN SD-WAN国际专线

监控报警服务RAM授权

DashVector

数据库 向量检索 大模型

【YashanDB知识库】删除用户组后,yasql不能免密登录问题

YashanDB

数据库 yashandb

【YashanDB知识库】崖山有哪些内存参数,Share Pool各个参数之间有什么关系

YashanDB

数据库 yashandb

【YashanDB知识库】GBK库,生僻字插入nvarchar2字段后乱码问题

YashanDB

数据库 yashandb

只需几步,小白也能用 AI 做出精致社交名片!

豆包MarsCode

豆包MarsCode

鸿蒙开发之无须申请权限访问相册图片

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

鸿蒙开发之不申请权限写入图片到相册

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

思维导图怎么制作?这8个顶流软件值得推荐!

职场工具箱

效率工具 思维导图 在线白板 办公软件 思维导图软件

安徽医科大学卫生管理学院与和鲸科技签署“101 数智领航计划”,共拓“医学+AI”学科建设与人才培养

ModelWhale

人工智能 大数据

一次天命之旅,见证科技自强

脑极体

AI

TaurusDB库表时间点极速恢复,大幅缩短数据恢复时间

华为云开发者联盟

数据库 数据恢复 :MySQL 数据库

全球首本关于动物干细胞的书籍,揭秘如何延长宠物寿命

财见

购买GPU服务器后可以做什么?

Ogcloud

gpu 云主机 云服务器 GPU云服务器 云服务器租用

802.11ac IPQ4029 and IPQ4028 Qualcomm 'comprehensive Comparison of A Full Analysis

wifi6-yiyi

wifi5 11ac

网络设备日志接入观测云最佳实践

观测云

日志 网络设备

Python中构建全局字典的详细指南

EquatorCoco

Python

支持全量&增量迁移!YashanDB增量迁移实现原理解读

YashanDB

数据库 yashandb

面试官:DNS解析都整不明白,敢说你懂网络?我:嘤嘤嘤!

EquatorCoco

面试

豆包大模型家族全面升级,重磅发布视觉理解模型

Geek_2d6073

阿里巴巴1688 API接口深度解析:如何高效获取商品详情与关键词搜索商品数据

代码忍者

1688API接口

分布式系统架构2:服务发现

快乐非自愿限量之名

架构 分布式

【YashanDB知识库】数据库一主一备部署及一主两备部署时,主备手动切换方法及自动切换配置

YashanDB

数据库 yashandb

今日分享 | 带你领略可视化设计之美

inBuilder低代码平台

设计 可视化 可视化设计

印记2024 | 20个“关键词”解码2024大型企业数智化

用友BIP

零代码 国产替代 用友BIP 中企出海 YonGPT

集成自然语言理解服务,让应用 “听得懂人话”

不在线第一只蜗牛

人工智能

微店API接口深度解析:如何高效获取商品详情及简短代码示例

代码忍者

微店商品详情API接口

Java程序员如何高效学习Spring Cloud Alibaba?

了不起的程序猿

微服务 架构师 SpringCloud java面试 springcloudAlibaba

有灵AOP平台首届编程挑战赛开启在即!CCF程序员大会赠票福利限时派送中!

网易伏羲

编程 aop 网易伏羲

体育赛事直播平台功能开发与运营策略

软件开发-梦幻运营部

寻找新冠致重症因素,如何通过云计算将分析时间缩短6倍?_服务革新_阿里云弹性计算_InfoQ精选文章