低代码到底是不是行业毒瘤?一线大厂怎么做的?戳此了解>>> 了解详情
写点什么

使用 EC2 Spot 实例和 TIBCO GridServer 在 AWS 上创建由 130 万个 vCPU 组成的网格

2019 年 10 月 24 日

使用 EC2 Spot 实例和 TIBCO GridServer 在 AWS 上创建由 130 万个 vCPU 组成的网格

我的许多同事都非常幸运,能够有不错的时间坐下来听听客户的意见,尽最大努力了解我们怎样才能更好地满足客户的业务需求和技术需求。这一信息经过谨慎处理后,用于决定新服务和新功能计划。


AWS 的金融业(常常简称为 FSI)客户都在关注将于 2019 年至 2021 年期间生效的《交易账户根本审查》(Fundamental Review of Trading Book,FRTB) 规定。这些规定要求(包括但不限于)采用新的方法来计算“在险值”,金融机构必须在纽约交易时段结束后,东京交易时段开始前的四个小时内完成计算。目前,我们的客户报告这一关键任务型计算消耗的 vCPU 数量以 200,000 为量级,而为了满足 FRTB 规定的要求,消耗将增加到 40 万到 80 万个 vCPU。虽然对于运行这一扩展计算需要的算力量级和频率仍有一些争议,但总体方向十分明确。


建设大网格


为了确保我们最好准备,帮助 FSI 客户满足新规定的要求,我们与 TIBCO 合作在 AWS 云建立了网格并进行了概念验证。 计算的周期性,加上在四小时内完成计算所需的处理能力和存储量,导致特别需要建立一个按需提供海量高成本效益计算能力的环境。


我们的客户已经在本地使用 TIBCO GridServer,并且希望在云上使用它。该产品为运行企业级的网格而设计。它将以虚拟化的方式运行应用程序,接受资源请求,然后按需动态预置资源。该产品的云版支持 Amazon Linux 和兼容 PostgreSQL 的 Amazon Aurora


通过与 TIBCO 合作,我们确定要创建的网格规模需要远远超过 80 万个 vCPU 这一当前消耗上限,并增加 50% 的安全系数,总计达到 130 万个 vCPU(是最大本地网格规模的 5 倍)。根据这一目标,账户限制也上调为如下参数:


  • Spot 实例限制 – 120,000

  • EBS 卷限制 – 120,000

  • EBS 容量限制 – 2PB


如果您计划创建这种规模的网格,您还应尽早让当地热情的 AWS 解决方案架构师参与。他们将会审核您的计划,为您提供架构指南,帮助您计划运行。


运行网格


按下 Go(开始)按钮并启动网格,观察它竞价并取得 Spot 实例,每个实例都将在两分钟内完成启动和初始化并加入网格。测试工作负载使用来自 OpenGammaStrata 开放源分析和市场风险库,并在他们的协助下完成。


网格按照计划增加到 61,299 个 Spot 实例(从覆盖 3 代 EC2 硬件的 34 个实例类型提取 130 万个 vCPU),在运行期间仅 1,937 个实例被自动回收和更换,运行成本每小时 30,000 USD,每个 vCPU 平均每小时 0.078 USD。如果相同的实例采用按需实例的形式,则运行网格的成本将约为每小时 93,000 USD。


尽管网格的规模如此大,EC2 实例的价格在竞价期间并未移动。这归功于 AWS 云的总体规模以及我们在去年底启动的平稳价格调整模型


为便于您理解运算能力的大小,我们估计该网格将以较大的优势超过 2007 年 11 月全球超级计算机 500 强排名第一的计算机,以及 2008 年排名第二的计算机。即使今天,它也将取得第 360 名的成绩。


希望大家喜欢 AWS 的这一成功故事,让您对云计算可以实现的量级有一个概念!


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/creating-a-1-3-million-vcpu-grid-on-aws-using-ec2-spot-instances-and-tibco-gridserver/


2019 年 10 月 24 日 08:00207

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布
暂无评论
发现更多内容

网络性能篇 (13讲)

程序员老王

计算机操作系统基础(一)---操作系统概览

书旅

php laravel 多线程 操作系统 进程

计算机操作系统基础(三)---进程管理之五状态模型

书旅

php laravel 多线程 操作系统 进程

神器工具:新一代多系统启动 U 盘装机解决方案

JackTian

工具软件 U盘启动盘 安装操作系统 ventoy ISO 镜像文件

查找算法系列文(一)一文入门二叉树

淡蓝色

Java 数据结构 算法 二叉树

Redis系列(三):缓存过期该如何剔除?RDB和AOF又是什么?

z小赵

Java redis 高并发 高并发系统设计

第四周 学习总结

冯凯

就餐卡系统架构设计文档

极客大学架构师训练营

iOS & Android 去马赛克处理

liu_liu

ios android 去马赛克

来了!8M/S+速度,Pdown复活!

程序员生活志

Week2:作业一

车小勺的男神

ARTS Week5

丽子

多个maven项目启动顺序

terrytian

maven

LeetCode 655. Print Binary Tree

liu_liu

算法 LeetCode

【极客大学】【架构师训练营】【第二周】总结:设计原则

NieXY

极客大学架构师训练营

wee1作业总结

极客大学架构师训练营

架构师训练营 - 第三周学习总结

清风徐徐

SpringBean的生命周期

编号94530

Java spring Spring Boot 生命周期

MySQL InnoDB存储引擎 - 事务

Arthur

ARTS Week5

时之虫

ARTS 打卡计划

计算机操作系统基础(四)---进程管理之进程同步

书旅

php laravel 多线程 操作系统 进程

设计原则与设计模式

dapaul

极客大学架构师训练营

食堂就餐卡系统设计

John

极客大学架构师训练营

每日一题-翻转字符串里的单词

程序员老王

LeetCode

架构师训练营:第四周第一节,互联网架构系统架构的演化

zcj

极客大学架构师训练营

别兜售你自己不会购买的东西

Neco.W

创业 销售管理 销售

如何让你的大脑更健康

兆熊

李艺:建立订阅者意识,当好一名知识服务生,做好知识课程

李艺

知识付费

微信支付的软件架构究竟有多牛逼...

程序员生活志

微信 架构

计算机操作系统基础(二)---进程管理之进程实体

书旅

php laravel 多线程 操作系统 进程

ARTS打卡-04

Geek_yansheng25

2021 ThoughtWorks 技术雷达峰会

2021 ThoughtWorks 技术雷达峰会

使用 EC2 Spot 实例和 TIBCO GridServer 在 AWS 上创建由 130 万个 vCPU 组成的网格-InfoQ