写点什么

AWS 瞄准科学社区,为高性能计算提供新的资源

  • 2011-10-10
  • 本文字数:1521 字

    阅读完需:约 5 分钟

Amazon Web Services (AWS) 团队公布了一系列资源,瞄准科学社区对高性能计算的需要。AWS 特别强调:在Amazon 云环境中,他们的“spot 价格体系”市场可以提供价格优惠的海量规模计算能力。

科学组织在处理数据分析时,常常要面对海量计算活动的需求。在AWS 团队指出的一个案例研究中,一家排名全球前五的制药公司在寻找分子建模方法,以处理数百万种化合物组合。有了 Cycle Computing 的帮助,该公司在 AWS 上使用一个有30000 个核的集群,仅用不到8 个小时就完成了任务。该集群跨越两个大陆,使用将近27T 内存,每小时花费1279 美元。Cycle Computing 指出:他们的客户从未想过在公司内部完成这样的科学分析,因为会把他们自己数据中心所有的资源消耗殆尽,而且长达数周。如果一家组织试图在内部完成如此重大的计算任务,常常需要非常大量的CPU,而且在任务启动之前会一直处于空闲状态。这也是Microsoft 在与 Pharm Exec 的访谈中提到的:

看看所有进入蛋白质折叠【译注】的数据。有研究大型分子产品的公司,这些产品一般被称为单克隆抗体(monoclonal antibody)。这些分子的活动主要是如何把自己折叠起来。在研究过程中,他们希望看到产品的基本序列,也想计算出分子的折叠过程。传统方式中,他们会维护海量的 CPU,这些 CPU 的计算围绕着上述活动展开,一般需要 70 个小时才能完成整个的蛋白质折叠分析。使用基于云的基础设施模式,服务器不需要一直开机。科学家可以在需要的时候再分析数据,不需要,服务器就不必运行。

AWS 声称:这个由 Cycle Computing 管理的计算集群不仅仅在规模和性能上令人侧目,同时在价格上也非常合算,因为他们使用了 Spot Instance 实例。与 Reserved 或 On-Demand EC2 实例不同,启动 Spot 实例是投标过程的一部分。客户制定出他们愿意为 Spot 实例每小时支付多少钱,只要 Spot 的价格仍然低于客户给出的阈值,Spot 实例就会一直运行。当价格阈值超过后,Spot 实例就会停止。Spot 的价格会比 Reserved 或 On-Demand 实例的价格便宜 50%,因此用它来完成只有财务上合算时才运行的、低优先级的计算工作,或是补充已有的 On-Demand 负载,都是不错的选择。

在新的“Spot and Science”页面上,对于如何利用类似Spot 市场提供的这些短时计算资源,AWS 团队点出了一些架构上的考量。AWS 提出四种架构风格,可以作为容纳潜在中断风险的解决方案,包括:Map/Reduce、Grid、基于队列的、以及基于检查点(Checkpoint)的架构。每种风格要么建议使用可快速完成的小量工作负载,要么建议当运行主机中断时重新运行,或是使用检查点定期保存工作。

AWS 的“Spot and Science”页面还包括案例研究、用例展示、成本节省分析、辅导和架构指南。即使用户不属于科学社区,如果希望用云完成高性能计算,也可以找到在这些用例中找到相关信息。 HPC in the Cloud 网站认为:

制药公司对云有相对高的使用率,这意味着对于其他公司来说,即使他们不需要找到疾病治愈方法或是改善人们的健康,他们也可以参考这个行业的案例,以了解云在真实世界中的使用方法。

【译注】蛋白质折叠(protein folding):蛋白质的基本单位为氨基酸,而蛋白质的一级结构指的就是其氨基酸序列,蛋白质会由所含氨基酸残基的亲水性、疏水性、带正电、带负电……等等特性通过残基间 的相互作用而折叠成一立体的三级结构。虽然蛋白质可在短时间中从一级结构折叠至立体结构,研究者却无法在短时间中从氨基酸序列计算出蛋白质结构,甚至无法 得到准确的三维结构。因此,研究蛋白质折叠的过程,可以说是破译“第二遗传密码”——折叠密码(folding code)的过程。具体可参考百度百科

查看英文原文: InfoQ: AWS Targets Scientific Community with New Resources for High Performance Computing

2011-10-10 03:321692
用户头像

发布了 479 篇内容, 共 164.8 次阅读, 收获喜欢 52 次。

关注

评论

发布
暂无评论
发现更多内容

怎样搭建企业内部wiki

小炮

企业 wiki

万亿级超高清产业变奏,分布式存储支撑关键应用落地

焱融科技

云计算 分布式 高性能 文件存储 影视渲染

6元自助洗车设备一套多少钱一台

共享电单车厂家

自助洗车机多少钱 自助洗车机价格 自助洗车加盟 6元自助洗车设备 6元自助洗车机

6元自助洗车店加盟需要多少费用

共享电单车厂家

自助洗车加盟 6元自助洗车店加盟 6元自助洗车 自助洗车加盟费

Linux之tr命令

入门小站

架构训练营 - 模块一

junl

架构实战营

系列解读SMC-R:透明无感提升云上 TCP 应用网络性能(一)| 龙蜥技术

OpenAnolis小助手

网络协议 技术分享 龙蜥社区 RDMA SMC-R

汇聚创新力量 企业智能化转型开源社区“星策”正式成立

第四范式开发者社区

程序员 金融 开源社区 企业转型 企业数据化转型

Dcm4chee--MySql版Docker镜像制作

birdbro

Docker DCM4CHE

6元共享24小时自助洗车加盟如何

共享电单车厂家

24小时共享自助洗车 6元自助洗车加盟

TiDB HTAP 遇上新能源车企:直营模式下实时数据分析的应用实践

PingCAP

数字资产管理系统解决方案

低代码小观

数字化 资产管理 企业管理系统 数字化经济 企业管理软件

Linux环境,C/C++语言手写代码实现线程池

Linux服务器开发

c++ 线程池 Linux后台开发 服务端开发 线程池源码

江苏财政的数字新径,大型政企的云上坐标

脑极体

自助扫码洗车机加盟怎么加

共享电单车厂家

自助洗车机价格 自助扫码洗车机 自助洗车怎么加盟 共享洗车加盟

【多云管理】多云管理如何化繁为简提高效率?

行云管家

云计算 企业上云 多云管理 多云

云效一站式DevOps平台

阿里云云效

云计算 阿里云 DevOps 云原生 云效

自助洗车加盟需要投资多少?分析下

共享电单车厂家

自助洗车机 自助洗车加盟

T3 出行 Apache Kyuubi Flink SQL Engine 设计和相关实践

网易数帆

sql 大数据

体验了一把最近很火的开源项目-MASA Blazor

MASA技术团队

C# .net 微软 组件库

2022 CCF国际AIOps挑战赛线上宣讲会成功举办

BizSeer必示科技

破解数据库内核人才困局:PingCAP 的思考与尝试丨Talent Plan 专访

PingCAP

全方位讲解 Nebula Graph 索引原理和使用

NebulaGraph

索引 知识图谱 #数据库

研发数字化管理,如何打破“上班摸鱼下班加班”的怪圈

方云AI研发绩效

团队管理 研发管理 研发效能 数字化转型 研发管理工具

脚本库详细说明 - 大屏云极简使用手册

shulinwu

【OH干货】给OpenHarmony 开发板配置网络

拓维信息

开源 OpenHarmony

Kubernetes官方java客户端之二:序列化和反序列化问题

程序员欣宸

Kubernetes java client

最新太原市五家正规等保测评机构名单看这里!

行云管家

网络安全 等保 等保测评 太原 等保测评机构

Linux云计算之VSFTP服务器概述-安装vsftp服务器端、客户端

学神来啦

Linux 运维

英特尔陈伟:以智能边缘解锁数智时代新未来

科技新消息

隐私计算势头迅猛,但金融行业用户需要“冷静”

易观分析

金融 隐私计算 AMC

AWS瞄准科学社区,为高性能计算提供新的资源_架构_Richard Seroter_InfoQ精选文章