阿里云的弹性计算为网站提供云服务器和负载均衡服务,在本次阿里云开发者大会上,笔者采访到阿里云弹性计算研发总监陈波、产品经理陈昕及阿里云计算产品线总监倪浩,谈论了关于容灾、安全性、云服务器与VPS 差异、如何应对DDoS 攻击以及对谷歌与亚马逊平台的讨论。以下是采访的详细内容:
InfoQ:本次是阿里云举办第二次开发者大会,在这一年的时间阿里云做了哪些改进?对开发者有哪些新的服务?对他们来说有哪些更吸引人的地方?
倪浩:从去年到现在,阿里云真正开始对外做商业化服务是去年 7 月份,去年一开始的时候基本上只有一个云服务器,那时候有 OSS,但是没有正式对外提供服务, 需要邀请码的方式才能试用,RDS 也是刚刚出来。
这一年下来,我们看到 OSS 上面已经有很多商业用户,RDS 也有很多商业用户,云服务器最重要的产品在中国影响已经非常之大。我们同时也推出了很多配套服务,以云服务为例,属于弹性计算范畴,弹性计算在这一年之内还发布了为云使用者提供了云监控。
去年到今天,重点的云服务器稳定性得到了很大提升,产品特性较之前也变得丰富。
InfoQ:刚刚提到了安全性,前段时间由于美国飓风 Sandy,包括亚马逊的服务也受到了影响,阿里云在面对灾难情况发生以后怎么去保证正常的服务?
倪浩:预防地震这种问题一定是异地备份的方式,今天阿里云在北京和杭州都建有机房,为用户提供云计算的服务。接下来很快也会在青岛上线,为用户提供云计算的服务,所以用户如果有相应的需求,必须在资源选择上就要考虑异地的方式,比如杭州用一些云服务器,青岛也用一些云服务器 。
InfoQ:如果不是那么大的灾难,但是用户的数据还是受到损坏的时候,这个时你们是用什么方法保障用户的数据?
陈波:首先云服务器上的数据底层是用飞天分布式存储做最终的存储,本身就有考虑物理位置上的分布,数据安全性非常高,单纯数据安全并不能阻挡病毒破坏造成的数据损坏,这时像弹性计算就提供了快照这样的工具,快照简单理解就是在云服务器运行过程中进行拍照,并把某一个时刻的状态保存下来。目前是自动的,将来用户可以进行自定义,并且完全是在线进行的,有一天发现用户的系统被破坏了,可直接回滚,这个回滚是可以在瞬间完成,或者用户也可以把快照挂在一个额外的硬盘,将里面受损的文件拷贝回来,这也充分利用了云计算底层的设置来保障用户数据的安全。
InfoQ:云现在已经落地到上海,有消息说亚马逊云也可能会进来,大家很喜欢把亚马逊跟阿里云做一个比较, 你们会不会觉得压力很大?或者是怎么去应对?
倪浩:这个问题我们也思考过,很多人也问我们这个问题,我觉得云计算这个东西很可能会跟互联网其他的东西一样,目前没有一个很大的跨国公司或互联网公司,即使在国外赫赫有名,不管什么原因,总是在国内生存不下去,我们想这里面是有原因的,在国外活得很好的模式,我们阿里云也向他学习了很多东西,也在经验上借鉴学习了很多东西。但今天的最大问题是不了解中国人的需求,所以按照他这个模式中国运作的话,很有很大的障碍。
比如亚马逊卖云服务器网络是按照流量去卖的,在中国这一套可能行不通,因为中国用户希望投出的钱是可以控制的,比如我一个月本来愿意花三千块钱在这上面买五兆带宽,亚马逊就不行了,有很多人去攻击你,马上流量的费用就暴掉了。在我们这里报五兆的流量就可以,别人挤不进来,对他来说他愿意这样。
国内用户需求没有到国外的阶段,但是控制成本的欲望只是其中一点,还有很多问题,无论是亚马逊还是微软,进来跟我们一样会面临中国一个很大的网络问题,南北格局、电信联通,双线的问题会非常头疼。阿里巴巴、腾讯、百度基本上花了十年的时间把这个事情理顺,同时成本控制的也都很好。从云技术上,我们承认他们的技术是非常领先的,我们也在努力的追赶,但在产品、运作模式上很难适应中国用户的需求,所以我们也一直在考虑这个问题,我们知道我们的优势,也知道我们的劣势,而且我们今天使劲把短处补上。这个主要靠国内的用户给我们平台越来越多的反馈。
陈波:我觉得国内客户与国外用户的需求,还是有点不太一样,国内开发者相对来说技术力量可能没有像国外那么强,比如架构的可扩展性。所以我们在产品设计上也会充分考虑到这一点,我们会做自动的迁移,像这种亚马逊的确可以做到,但是却一直没有提供,这种在我们实际运营过程中,帮了我们很多忙,亚马逊能不能给客户一个贴身的服务,是用户选择不同服务商的一个很重要因素。
InfoQ:能不能顺便说一下,云服务器和 VPS 的差异?
陈波:VPS 是一台机器划分成 N 多个,供 Apps 使用。这里面可能 CPU 内存都是共享的,有的时候一台机器上面可能会几十、上百个 VPS。但是在我们云服务器上,内存这些都是独享的,给你 4G,你一定是得到 4G,不会出现大家抢内存,谁都跑不动,这是从虚拟化角度来看。
我们的虚拟化平台与底层的飞天分布式系统结合,刚才提到的数据的多份拷贝,数据安全性的保证、快照,以及其他的一些配套服务,这些是与 VPS 最大的不同。
InfoQ:刚才也提到了安全问题,弹性计算平台对安全有很高的要求,在防止 DDOS 方面,咱们有哪些应对的措施或是策略?
陈波:其实有两类 DDoS(分布式拒绝服务,Distributed Denial of Service),一种是通过控制成千上万台肉鸡,对服务器进行大流量的供给,用流量把你淹没。另外一种通过发起几个连接,把应用的连接撑爆。这两种现在在我们平台上都能够自动处理,它的原理是通过分析进入机房的流量,一旦发现有攻击特征, 就会自动将流量路由到清洗设备上,在清洗设备上,会将攻击流量清洗掉,把正常流量导到后面。这样用户的网站基本上不会受到影响,现在清洗能力大概在 10G+ 左右,也就是在被 DDoS 时,如流量在 10G+ 的范围内,用户的网站是不会受到影响的。
倪浩:超过 10G+ 是我们一个限制。淘宝会经常被攻击,所以清洗能力非常大。 最近的一次数据统计,1 个月的时间里,大概处理了 1000 多起的 DDoS 攻击事件。其中最大的一起的流量攻击在 28G 左右,通常在这个数量级的攻击几乎是没有人能挡住的,通常购买的服务器带宽都是 5 兆,这同 28G 差了多少个数量级。平均的流量大概在 1G 左右,这也超过了单个云服务器的支撑能力。所以清洗设备在此时发挥了很大的作用,从而保证用户的网站能够被正常访问。
InfoQ:如何看待开源对于云计算的影响?
倪浩:我觉得像 Open Stack 这样的平台目前来说更适合解决一些私有云的方案,大规模的运营需要解决云计算核心的问题,比如分布式存储,不攻破核心技术是没有办法做弹性计算的。优秀的云计算平台首先要是一个非常好的管理平台,架构要容易扩展。
InfoQ:记得王坚博士在接受采访时曾说到,阿里要做未来的谷歌、亚马逊,这句话应该如何理解?
倪浩:因为谷歌、亚马逊是不同的公司,他们做的好的地方也不一样,王博士的意思是我们要吸收他们两个的优势之处,谷歌的优势在于通过一个平台支撑所有的服务,这点是毋庸置疑的,但是谷歌对外开放服务的能力很差,我们要学谷歌的就是通过一个平台来支撑所有的服务。
亚马逊厉害的地方在于对外开放服务的能力,这是我们要学习亚马逊的地方,亚马逊不好的地方在于,他们自己做系统都要基于两个不同的平台,这要花很大的精力。
所以,我们要学习谷歌平台化的策略,然后像亚马逊一样对外提供更好的服务。
评论