丁登,2006 年毕业于浙江大学,同年加入网易杭州研究院,从事一线运维工作至今。强迫症患者。习惯强烈地表达自己的观点。丁登的微博是 @bofh 。本次 QCon 大会丁登会分享网易研究院自动化运维的经验。在大会举办之前,InfoQ 对丁登做了一次采访。
您已经在网易杭州研究院专注从事了六年多的运维工作,能否先讲讲您眼中的运维究竟是什么?
建立并维护基础设施,为产品提供运行环境。
我个人从事的主要是系统方面的运维工作,偏重于服务器、操作系统以及通用软件等领域。
能否再谈谈这么多年运维工作的变化与演进?
由于没有历史包袱,网易杭州研究院从 2006 年成立之初就非常注重自动化运维方面的实践。这些年的主要变化是在坚持运维自动化的前提下,更加关注其适用场景。因此,如果说从纯手工运维走向全自动化运维是一个趋势,那么我们就是在前进的道路上后退了一小步——因为我们发现,步子迈大了真的容易扯着蛋。
时代与规模的变化究竟给运维工作带来了怎样的冲击?
我们没有经历过纯手工运维的阶段,因此对于规模的变化并不十分敏感。
对于规模的不同,您对实施运维工作会有怎样的取舍?
只有当同类资源超过一定数量的时候,我们才会对其实施自动化管理;否则我们会采取半自动甚至纯手工的方式。
能否简单谈谈您对自动化运维的理解?
我们实践的自动化运维与制造业的自动化生产非常类似,都是利用工具实施预定义的流程从而实现操作的低成本复制,并保证结果与预期的高度一致。
操作流程的预定义可以增加运维工作的透明度,使整个基础架构更加可视,这是自动化运维在降低运维成本之外的另一个作用。
自动化运维与基础架构有怎样的关系?
运维是基础架构的实施方式,自动化运维是基础架构实施方式的一种。
云计算时代的运维有着怎样的机会和挑战?
这跟所属公司在云计算产业链上的位置有关。
对于云计算服务的提供方,有人说是“三分技术,七分运维”,我觉得这得看这里面所说的运维到底包含了哪些内容。单纯从系统运维的角度看,任何产品都只是可执行文件加配置,因此云计算虽然特殊,但与其他产品并没有本质上的不同,就像 OpenStack 与 OpenSSH 并没有本质上的不同一样。
对于云计算服务的使用方,主要是省去了硬件采购与维护的成本,相当于是外包了一部分的运维工作出去。
您对运维领域的知识学习与积累有什么经验和大家分享吗?
我在网易负责运维的第一个产品非常小。正因为它小,我得以把它翻了个底朝天。我觉得之所以在后续接手较大规模项目的时候在技术上没感觉到有多吃力,主要归 功于那段时间把相关的工具链都从头到尾学习了一遍。运维是一个知识点非常多但并不是对每个知识点都有很高要求的工作,因此我觉得从小做到大要比从点做到面好。
另外,我认为完整地学习一个新知识点的最好方法是阅读官方文档而不是网上搜一篇第三方教程然后把命令从头到尾敲一遍——也就是说,理解重于实践。
在本次大会上丁登还会针对此话题做深入讨论。会前会后更有机会与其当面交流。目前大会报名已接近尾声,票量有限,欲购从速。大会网址: http://www.qconhangzhou.com 。报名页面请点击这里。
评论