免费下载案例集|20+数字化领先企业人才培养实践经验 了解详情
写点什么

解读 2015 之运维篇:变化、发展、涨姿势

  • 2016-01-22
  • 本文字数:2370 字

    阅读完需:约 8 分钟

编者按

2015 年,整个 IT 技术领域发生了许多深刻而又复杂的变化,InfoQ 策划了“解读 2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。

本文为“解读 2015 之运维篇”。2015 年虽不是运维发展最快的一年,却是运维变化最大的一年。前一年大家普遍认为云计算是运维的救命稻草,而 2015 年的多次“灾难”让人警醒。越来越多的企业开始对运维更加重视了,大力提倡自动化运维,围绕 “自动化运维”相关的探讨也越来越频繁,在一次又一次的思想碰撞中擦出火花,并实施落地。与此同时,无论是使用开源软件的数量还是采用开源软件的企业都在持续增长。许多公司对自己的一些软件进行了开源,其中包括 Google、Facebook、微软和 IBM 等。企业用户以前所未有的速度拥抱开源,很多优秀人才也投身其中,开源不再可有可无。除此之外,运维基础系统的更新迭代也不容小觑。还有哪些涨姿势?我们一起来盘点。

运维的多事之秋

[2015.5.27] 支付宝因杭州机房网络光纤被挖,导致数小时部分用户业务不可用
[2015.5.28] 携程网瘫痪事件,全网业务中断 12 小时
[2015.6.1]UPYUN 连续遭遇两次大规模流量攻击,影响业务 6 小时
[2015.6.6]QingCloud 因雷暴引起的广东 1 区 IDC 电力故障,业务中断 2 小时
[2015.6.6]LeanCloud 多项服务发生中断,持续 4 小时
[2015.6.15] 知乎机房故障,影响系统使用近 2 小时
[2015.6.21] 阿里云香港节点宕机,业务中断 13 小时
[2015.6.19] 开源中国 Git@OSC 连续遭受 DDoS 攻击
[2015.09.01] 阿里云升级云盾引入 BUG,导致误删用户文件
[2015.09.22] 七牛云存储服务故障,业务中断 83 分钟
……

通过这些不完全统计,可以看出云故障是比较多的,在出现故障后,虽然公司会有财务及形象上的损失,但是心态一定要好,不能手忙脚乱。沉着应对,高效处理,快速恢复才是运维人员的“正确姿势”。2015 年,我们从这些故障中不断地总结,在技术提升的同时,更应该转变的是观念,正视容灾备份的重要性,将风险降到最低。伴随着基础设施的逐步完善,未来这些层面都不再是问题,再者也可以利用工具的优势来解决高用性架构。

运维工具组合的进化

随着云计算和开源的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务,IT 系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要运维管理者时刻保障核心业务稳定可用,企业运维中的痛点和难点也急需解决。以下运维工具在这一年更加火爆,为企业业务提供强有力支撑:

  • 命令执行与配置管理

    • Ansible
    • SaltStack
    • Puppet
  • 持续交付与代码

    • Jenkins
    • 国内 Coding.net, GitCafe,Git@OSC 的兴起
    • GitLab 的进步与稳定
  • ELK 生态的成熟

    • 提供日志收集,分析,和实时搜索,与可视化监控
    • 最近发布 2.0 大版本
  • 应用监控

    • APM
  • 国内开源

    • open-falcon

一套好的运维工具,能够将应用、网络、计算、存储、虚拟化等资源的性能及告警信息综合分析(可视化),通过简洁易懂的界面,直观呈现业务健康水平。当出现故障时,能够先从全部业务的宏观视角,确定关联和影响,再通过智能钻取和故障定位技术,缩小故障定位范围是在计算、应用还是网络,从而明确问题职责,帮助运维和研发准人员确定位业务故障位置。国内的运维人员所需要做的就是利用 Django 结合开源工具,开发出适合自己业务系统的平台,通过一定的流程控制,将业务紧密贴合,从而逐步达到自动化运维的目的。

运维基础系统的进化

企业最重要的是业务系统,所有的工作都是围绕正常开展业务而展开的。而 Linux 系统更是技术人员最基本的基石。今年 4 月份 Linux4.0 发布,这是一个新的里程碑,更新“live patching”(实时补丁) 机制,意味着以后为内核打补丁不用重启系统了,增强了系统的高可用性。

随着容器技术的兴起,许多新的专门运行容器的 Linux 发行版本也出现了。光版本就迭代了 9 个,火得不要不要的。这应该是其它开源软件所无法超越的,同时也整合了工具集合:Toolbox,为部署提供便利。不过这也使得原本为 Docker 做出巨大贡献的 CoreOS 与 Docker 分道扬镳,并独立发布了 Rocket(rkt),认为 Docker 已经忘记初心,从而独立出来做一个更纯净的容器。Rocket 没有像 Docker 那些为企业用户提供的“友好功能”,比如云服务加速工具、集群系统等。反过来说,Rocket 想做的,是一个更纯粹的业界标准。

运维脚本语言的进化

提到脚本语言,今年最火的非 Python 莫属,同时也是 Python 社区稳定改善的一年。这一年 Python2 由 2.7.9 进化到 2.7.11,然而 2.7 版本可以说是非常稳定成熟,用 Python 之父 Guido 的话说:“是想不到任何可以加入的新特性,因此不会发布 2.8 版本”。同时大量重要开源库通过 six 兼容包来同时支持 Python2 和 3,这让开发者转型 Python3 变得不再那么遥不可及。Python3 在 9 月份横空出世了 3.5 版本,正式宣告 Python 成为一个从语法上原生支持协程的语言,这一特性也吸引着越来越多的开发者迁移到 3.5,越来越多的开源库迁移到 Python,这个方向的改变是非常明显的。

除了 Python 外,Django 无疑也是一匹黑马,运维本来跟 Web 开发没有太多关联,但 Django 的长足进展,却帮了国内运维一个大忙。在大力提倡运维开发的时代,Django 的出现让运维非常快速方便地开发部署自动化工具,极大地释放了运维的生产力。2015 年,Django 从 1.7 升级到 1.9,支持大量新特性,开发部署越来越简便,而且生态越来越成熟, 2016 年即将朝着 Django2.0 的方向迈进。

总结

这一年,在大规模、复杂架构的催生下,运维技术不断变化、发展、涨姿势。自动化运维被推到一个新的高度,给传统企业带来了福音;给基础运维带来了巨大的挑战与机遇;同时也给越来越多的企业带来了新的抉择;开源技术的飞跃、脚本语言的进化等也给运维行业带来了革命性的影响。展望 2016 年,相信容器技术将持续爆炸式增长,云运维更加简单高效,让我们拭目以待,尽情拥抱他们吧。


感谢黄丹对本文的审校。

2016-01-22 01:294436

评论

发布
暂无评论
发现更多内容

流计算中的死锁

Damon

6月月更

Zookeeper入门基础

No Silver Bullet

zookeeper 6月月更

FastCorrect:语音识别快速纠错模型丨RTC Dev Meetup

声网

语音识别 RTC Dev Meetup

成为架构师需要点亮哪些知识树

奔向架构师

数据仓库 架构师 6月月更

模拟红绿灯来看GetX的定向刷新

岛上码农

flutter ios 前端 安卓 6月月更

统一返回结果

卢卡多多

返回值 6月月更

GNU/Linux知识库(1)- 历史和演变

冯亮

Linux DevOps GNU

字节Pico走“小”路

科技新知

开源Star10K+数据库工具Beekeeper上手体验,免费够酷值得拥有!

MegaQi

数据库管理工具 6月月更 #开源项目体验

【愚公系列】2022年06月 通用职责分配原则(六)-多态原则

愚公搬代码

6月月更

学生管理系统的考试试卷存储方案

爱晒太阳的大白

市场冷空气来袭,SeekTiger如何逆流而上?

鳄鱼视界

flutter系列之:按比例缩放的AspectRatio和FractionallySizedBox

程序那些事

flutter 程序那些事 6月月更

【LeetCode】乘积小于 K 的子数组Java题解

Albert

LeetCode 6月月更

力扣每日一练之数组上篇Day1

京与旧铺

6月月更

颠覆Web2 社交媒体,Liberty 计划在波卡上找到了归宿

One Block Community

区块链 科技

Docker进阶(一):docker -v目录挂载

No Silver Bullet

Docker 6月月更

使用统计数据消除生活中的无谓

宇宙之一粟

贝叶斯公式 6月月更

什么是 IPv6?IPv6有哪些优势?

wljslmz

ipv6 IP地址 网络技术 6月月更

Vue-13-Vif和Vshow的区别

Python研究所

6月月更

Java—JVM II

武师叔

6月月更

Linux开发_Linux下进程编程

DS小龙哥

6月月更

走近分布式缓存Memcached

No Silver Bullet

memcached 分布式缓存 6月月更

稳了github star突破9k即时通讯IM开源项目OpenIM版本发布-生产环境重点关注

Geek_1ef48b

JavaScript基础语法知识遨游记

未见花闻

6月月更

彻底搞懂 select/poll/epoll,就这篇了!

C++后台开发

网络编程 linux开发 epoll select C++开发

NodeJS 读写文件 🎠

德育处主任

node.js 6月月更

vue动态路由

小恺

6月月更

数据库每日一题---第16天:计算特殊奖金

知心宝贝

数据库 云计算 前端 后端 6月月更

HashSet与WeakHashMap的理解

源字节1号

uni-app进阶之模版语法与数据绑定【day7】

恒山其若陋兮

6月月更

解读2015之运维篇:变化、发展、涨姿势_DevOps & 平台工程_刘宇_InfoQ精选文章