写点什么

够快服务的云迁移之路

  • 2012-10-18
  • 本文字数:2660 字

    阅读完需:约 9 分钟

够快是国内一家基于云存储的协同服务提供商。面向各类规模的企事业单位、政府机关以及学校团体,提供建立在阿里云平台上的云存储以及基于云存储的各类协同应用服务。InfoQ 就够快的架构向云端的迁移等问题对够快工程师进行了采访。

InfoQ:“够快”为什么要将业务放到云上?之前是否有一个阶段是没有将服务器放到云上而是自己来负责服务器的处理?

蒋烁淼:之前有。

InfoQ: 之前的那种方式遇到了什么问题?为什么会决定把业务迁移到云上?

蒋烁淼:是这样的,首先一点就是说像我们把业务放在自己部署的服务器上,一开始是规模相对较小,服务器加起来不超过 20 台,那么给我们的感觉是自己能够维护的过来,当时也开发了一些程序来做监控、管理,而真正遇到的瓶颈产生在网络方面。因为我们做的是存储服务,做存储服务很重要的一点就是网络。因为中国的网络服务商有联通、电信、移动等,在这种大的网络环境下,我们就需要至少建立联通、电信两个机房,并且我们也就是这样做的,这就导致我们的机器数量翻倍。并且随着业务的发展,我们需要管理的服务器规模差不多接近 100 台,这样我们的服务器就相当于构成了一个私有云,但是我们发现除了机器本身的成本以外,我们还需要额外的付出:

针对现在的 100、200 台机器的私有云进行优化,需要更强大的运维开发团队、需要更好的带宽。

我们的服务器放在不同的机房,在每个机房还需要专门的维护人员。因为我们做的是云端存储,硬盘很容易损坏,因此当这样的情况发生以后需要及时更换硬盘、修复数据,那就要求我们随时对服务器进行监控。实际上在服务器监控、管理这一块耗费了我们很大的精力。

阿里云的出现就给我们这样的感觉:虽然其硬件、带宽成本比我们自己部署要贵一些,但是我们节省了很多隐形成本。我在使用阿里云的时候,深有体会的这一点。在我们自己部署服务器的时候,一开始放置了 10、20 台服务器,但是如果后来业务暴增需要 100、200 台机器 ,但是电信机房没有空余的机位,我们就只有两个选择,一是将服务器换一个机房,另一个就是在另一个机房部署服务器,然后通过拉光纤等方式将两个机房串起来。这个成本是很大的,虽然有足够的资金来做这个事情,但由于我们还要提供持续的服务,所以时间上我们至少需要一、两天来部署这个架构。在这个背景下,我们选择使用阿里云。

InfoQ:我们相信云可以给企业带来很多帮助,比如成本上的降低,但是云不是万能的,那么够快在使用阿里云的过程中是否遇到过没有想到的问题?又是如何解决的?

蒋烁淼:实际上我感觉“够快”是伴随着阿里云一起成长的。我们最早用阿里云的时候,包括 OSS 系统,还是存在很多问题的,我们也反馈了很多 bug。其实,我感觉这个事情需要客观的看待,我相信云现在还存在很多问题,但是这些问题我们自己做也会碰到,不同的是现在是阿里云来帮助我们解决问题。拿前几天遇到的一个情况来举例:前几天我们发现网站突然访问不了,后来我问了一下阿里云,他们说是遭遇到了 DDOS,然后他们差不多用了 2 个小时就把攻击流量停止了。因为之前我们自己部署服务器的时候也遇到过这样的问题,就是也被 DDOS,对于我们就需要一星期或者被迫换 IP 的方式才能将这个 DDOS 躲过去。实际上这也是另外一个问题,比如我们在运营的时候服务器宕掉、被 DDOS 或是阿里的误操作导致服务器宕机,但是因为我们自己也部署过机器,也不确保自己的技术能够保证万无一失,包括盛大或者亚马逊的云也不能够完美无缺,而这些问题在我们个人运作时会遇到时,那么阿里云也会遇到。不同的是当我们个人遇到的时候可能是自己想办法去解决,而现在就靠托管的服务商来解决,从经营角度上就是不知道他什么时候会解决这个是差距,其他的都一样。实际上我觉得中国云服务刚刚兴起,包括盛大、阿里的服务还有待提高,但是我相信他们如果把这个服务做下去,必然比我们自己做发展的要快。毕竟跑在他们机器上的服务不止我们自己一家,我可能只会遇到自己的 bug,不妨说我提供了一个 bug 给阿里云,他就会将这个 bug 解决,那么整个平台就不会再遇到这个问题。

InfoQ:我是不是可以这样认为:“够快”是和阿里云一同成功,从无到有,从小到大发展起来?

蒋烁淼:是的,我们的确见证了阿里云的成长,他们的很多服务都不错,包括测试服务、OSS 等。

InfoQ:对于使用云的企业来说,我觉得对于团队带来的变化是不是运维成本急剧降低?

蒋烁淼:运维分两块,一个是客服运维,这个是不会减少的。主要是服务器的运维的成本降低,现在我们就一个人来负责。他就是每天看下阿里云服务器的运行状态,比如空间、网络、配置是否正确,如果出现异常就反馈给阿里云,然后由他们进行修复。

原先我们自己部署服务器的时候,如果要扩大机房就需要招至少 5 个人的团队来做这个运维管理。

InfoQ:看来阿里云给够快提供了生产力提升和成本降低,间接造成企业竞争力的提高。

蒋烁淼:是的,那么从另外一个角度,我们现在是为其他的企业提供包装过的云服务。在我们的产品使用了阿里云以后就会增强用户对我们的信心,因为服务是阿里提供支持,用户感觉就会对于服务感觉很好,包括数据安全性等各个方面会更放心。同时,数据托管在阿里云,我们自己也比较放心。

InfoQ:最后一个问题,当初在选择云服务提供商的时候,是哪些因素使得你们选择阿里云?

蒋烁淼:最重要的一个方面是访问速度。我们的这些服务主要是面向国内,当时试过包括微软在内的很多国外服务,发现这些访问速度比较慢,而亚马逊、谷歌的服务容易被屏蔽。那么国内剩下的大公司就是盛大、阿里,当然现在国内的其他小公司也提供云平台,我个人感觉他们只是提供虚拟机,因为我们的业务要求需要服务商提供整套解决方案,包括存储、结构化数据查询、虚拟机、负载均衡等。

阿里云是内置的超级网络,教育、电信、联通等使用同一个 IP 地址,网络优化到访问速度都差不多。基于这些,我们选择阿里云。

同时还考虑到用户的体验,因为对于用户而言,需要用户来选择联通或者电信入口,如果用户选错了,稍后的服务就会不顺利。

号外:够快还将在今年 11 月 9 日的阿里云开发者大会2012 上进行技术分享,欢迎关注本次大会(大会将于2012 年11 月8-9 日杭州举行),阿里云开发者大会大会由阿里云主办,云集互联网业界领袖、知名企业高管、云计算技术专家、资深开发者等各路精英,共同分享云计算技术革新与开发经验,探讨中国云计算产业的落地实践与创新发展。点击报名参加


给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-10-18 07:122066
用户头像

发布了 88 篇内容, 共 263.2 次阅读, 收获喜欢 8 次。

关注

评论

发布
暂无评论
发现更多内容

模块9 毕设

SAKIN

aardio 开发桌面应用,这几点必须要掌握!

星安果

Python aardio

linux几个没用但是有趣的命令

入门小站

Linux

构筑“数据连接器”,腾讯云大数据推出“开源开放”战略

腾讯云大数据

大数据

浅谈DNS递归解析和迭代解析之间的区别

喀拉峻

网络安全

08 K8S之资源对象介绍

穿过生命散发芬芳

k8s 11月日更

GitHub多次霸榜,两个月拿下10000+Star,不愧是阿里内部开源的SpringCloud Alibaba笔记

Sakura

Java 编程 架构 面试 计算机

基于 RocketMQ 构建阿里云事件驱动引擎EventBridge

阿里巴巴中间件

阿里云 RocketMQ 云原生 中间件 事件总线

使用 Spring Boot 构建可重用的模拟模块

码语者

Spring Boot Module

Go语言,深入了解 RWMutex 实现原理

微客鸟窝

Go 语言 11月日更

设计模式【3.3】-- CGLIB动态代理源码解读

秦怀杂货店

Java 设计模式

死锁是如何工作的

卢卡多多

死锁 11月日更

[ CloudWeGo 微服务实践 - 07 ] 阶段总结

baiyutang

golang 微服务 11月日更

巩固Java基础,备战来年跳槽——你的薪资自己说了算

Java 编程 程序员 面试 线程

阿里云性能测试服务PTS新面貌 - 压测协议、施压能力全新升级

阿里巴巴中间件

阿里云 中间件 性能测试 SaaS 压测

远程代码执行漏洞分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

树莓派

IT蜗壳-Tango

11月日更

Flink 实践教程-入门(5):写入 ClickHouse

腾讯云大数据

流计算 Oceanus

科技热点周刊|马斯克卖掉特斯拉 10% 股票;Facebook 停用面部识别系统;微软拥抱 Metaverse;雅虎退出中国

青云技术社区

云计算 facebook

在线2-36进制转文本工具

入门小站

工具

【死磕NIO】— 阻塞、非阻塞、同步、异步,傻傻分不清楚

chenssy

11月日更 死磕 Java 死磕 NIO

7张图揭晓RocketMQ存储设计的精髓

阿里巴巴中间件

阿里云 技术 RocketMQ 中间件 存储

Prometheus HTTP API 查询(二) 表达式查询

耳东@Erdong

Prometheus PromQL HTTP API 11月日更

GitHub标星139K的:“嵌入式Linux系统开发教程”

Java Linux 编程 程序员

Android C++系列:通过 JNI 访问 Java 字段和方法调用

轻口味

android 11月日更

Flink 实践教程-入门(4):读取 MySQL 数据写入到 ES

腾讯云大数据

流计算 Oceanus

龙蜥操作系统将捐赠开放原子开源基金会

OpenAnolis小助手

Linux centos 开源社区 开放原子开源基金会

《Kubernetes in action 读书笔记》:容器技术的发展

后台技术汇

Kubernetes 11月日更

移动端自动化 AutoJS 快速入门指南

星安果

自动化 Autojs

如何解决 fs.renameSync() 跨区移动文件的问题

liuzhen007

11月日更

算法入门-快速排序

ES_her0

11月日更

够快服务的云迁移之路_服务革新_张龙_InfoQ精选文章