写点什么

从容器到运维,一篇文章看懂技术的变革与未来

  • 2017-06-25
  • 本文字数:3600 字

    阅读完需:约 12 分钟

2015 年到 2016 年,是业界普遍认为的容器技术爆发的一年,短短一年多时间里,容器技术在中国大陆完成了从零星概念到烽火燎原的壮举。而在这场以“Cloud Native”技术为基础的革命当中,中国市场无论是在资本投入规模还是工业生产案例上,都以前所未有的强势姿态,与美国本土形成了这一技术生态的世界两级。在这段进程当中,由 InfoQ 中国倾力举办的两届容器技术大会,着实扮演起了举足轻重的推动作用。无论是 Kubernetes 负责人 Dawn Chen 富有远见的技术视野,还是“老云计算人”梁胜博士精辟入微的产业剖析,都为当时国内正处于成长期的容器生态注入了关键的推动力量。

而今年 9 月,CNUTCon 将再次在上海开启,但是这一次它会带着一个新的名字:全球运维技术大会。

运维的华丽转身

时至今日,容器技术在国内大多数企业中落地已成为一种共识,而国内的生态系统,也呈现出了企业产品、开源社区和公有云齐头并进的良好局面。在这个时间点上,CNUTCon 大会的自我升级,恰如其分地诠释了这一变革背后所凸显出来的新的技术价值:运维,将会以一种全新的姿态,出现在台面上来。

如果说在容器技术之前,DevOps 和微服务只能更多地作为一种最佳实践而存在的话,如今重出江湖的 SRE 理念则充分印证了容器技术对于落地 DevOps 所起到的关键作用。大规模作业的技术保障工作从人工到机器的进化过程中,作业单位的容器化和作业平台的标准化无疑正在受益于容器技术的日渐成熟和开源编排管理框架的迅速普及。以往作为大公司秘密武器而存在的容器化作业编排与管理理念,正在通过开源项目和技术社区迅速深入到了各大公司的运维和基础架构体系当中。

DevOps 的概念变迁,从繁到简,从抽象到具象,已经成为了现今各家基础架构部门发展的必然趋势。而在本次 CNUTCon 中,SRE 与微服务最佳实践,以及 DevOps 主题都将为听众展现后容器时代的运维团队如何将这些来自 Google 等先进的作业编排和运维理念真正在自己公司落地的来龙去脉。这个变革过程中浮现出来的各种技术与管理问题和应对手段,都将是难得的一线经验。

未来 = 人工智能 + 运维

早在 Borg、Omega、Heracles 等优秀论文当中,我们就已经得以一窥国外一线技术团队在提升集群资源利用率、优化数据中心能效工作中引入机器学习方法的很多先进实践。这些既包括了基于经验值来提前判断作业资源使用情况的预测工作,也有在集群调度过程中通过梯度下降来计算多维度约束下资源分配最优解的优化方法。而实际上,在国内诸多技术公司中,人工智能辅助的运维能力也早已应用在大家所熟知的各项互联网产品的支撑和保障工作上。在这样的背景下,CNUTCon 此番开设了智能化运维主题,并邀请到了百度公司智能运维技术负责人来担任专题出品人。在机器学习工具已经开始挑战 DBA 地位的今天,我们还有什么理由不去关注运维这个传统技术工作与新兴机器学习算法之间的碰撞呢?

容器:云时代的基础依赖

回归到容器技术本质上来,随着国内技术团队对容器理念的逐渐接纳,容器技术本身的调优和扩展工作已经成为了这一领域不可规避的技术问题。而相比国外的“拿来主义”,国内技术团队往往钻研更深,使用要求也更苛刻,这也使得很多公司对开源容器项目都有不同程度的定制甚至重写以满足不同的业务要求、环境压力和规模需要。可是容器定制到底应该遵循怎样的技术规范,容器本身与上层编排系统的界定又该如何划分?为此,CNUTCon 设置了容器优化与实践专题,紧贴容器技术本身“自底向上”的设计思想,邀请了业界知名的内核技术专家来从安全、性能、多租户等多个维度为听众分享容器技术本身的各项扩展和定制工作。“掌握核心技术”,从容器优化与实践开始!

容器技术本身相辅相成的,自然是容器的编排与管理工作。事实上,Kubernetes 项目之所以能有今天的地位,除了 Google 等实力加成之外,其实也正是拿捏准了“用户只关心容器管理 API 而非容器本身”这一利害关系。更有意思的是,相比国外略显“千篇一律”的落地案例,国内厂商在容器编排管理的实践上可谓百花争鸣,这里既有大规模数据中心操作系统的设计思路,也有颇具匠心的容器公有云产品,更有集自家“核心科技”于一身的大型基础架构平台。容器 + 运维自动化,容器 + 机器学习,容器 + 互联网金融,容器 + 传统企业,国内 IT 环境和差异化市场的独到之处,在容器云的设计与实践上体现得淋漓尽致。在这个专题,我们有知名 QCon 出品人再次坐镇,为听众筛选出最干货、最真实、最贴近社区的优秀案例。

泛娱乐时代的幕后英雄

值得一提的是,这一次,CNUTCon 还专门设置了游戏开发与运维专题。在这个中国超越美国成为全球最大游戏市场的时间点上,如果我们回头来总结国内游戏行业的运维技术现状,却有种略显陌生的感觉。这也难怪,这一部分技术人员长期维护着世界上最延时敏感、架构复杂、性能关键的一批程序,但往往缺位于一线技术大会的主题,这不得不说是一种遗憾。事实上,相比互联网运维领域国外科技巨头的话语权,国内游戏行业的基础平台实力其实一直以来在业界首屈一指。就比如在容器云落地这样的新兴技术实践中,一个一直以来被大家所津津乐道的经典案例并非来自老牌互联网公司,而正来自于国内某游戏行业巨擘。不难预料到,后容器时代游戏行业的运维一定会越来越多的出现在公众视野,这是游戏类应用天生对性能和迭代敏感所带来的必然选择。而这一次,腾讯游戏运维总监亲自坐镇 CNUTCon 的游戏开发与运维专题,势必能够为这个细分技术领域的兴起再添一把火。

除此之外,在这次的 CNUTCon 上,运维基础架构的主题将会是重中之重。技术人员耳熟能详的 Borg、Omega、Mesos 系统,在国内其实也有优秀的同类项目,他们的设计与架构,对于 DevOps 理念的落地的意义不言而喻。而与此同时,运维监控、大数据、数据库、互联网金融运维等细分场景主题,都在本次会议中有着一席之地,对于正在经历底层系统变革的企业和团队来说,借鉴这些最佳实践无疑是跳出”摸石头过河“困境的有力手段之一。

运维:未来已来

如此种种,只是这个技术世界正在发生的深刻变革的冰山一角。运维,这个传统的技术工种,在容器技术、人工智能的强力加持下,已经从”机械劳动“这样的刻板印象中蜕变出来,成为了任何一家技术公司所必须依赖和大力投入的核心技术能力。这样的大背景下,企业间的竞争也已经从线上业务争夺,延续到了自身技术实力的直接碰撞。而运维与基础架构领域的实力比拼,正是这场新”军备竞赛“中参与方 PK 的关键之一。这也正是长期以来国外互联网巨头一再在该领域强势输出的重要原因:拳脚功夫固然重要,然而一身浑厚的内力和修为,才是大侠们闯荡江湖的不二法宝。

这也是为什么这次 CNUTCon 一定要把运维作为本次大会的关键词。国内互联网和 IT 环境,论产品能力、用户规模、资本营销,一时间世间无两,但真正落到底层基础架构、核心平台等体现“内力”的领域,我们依然与全球范围内的很多同行存在着不小的代差。在很多国外科技企业普遍推行 SRE 职位、大力提升运维和基础架构人员话语权的今天,我们国内仍然有很多团队尚欠缺基础运维平台的概念,上线流程往往依赖人工而被非技术因素左右导致效率低下;另一方面,新技术在很多组织内部落地困难,容器化理念在开发中遭受排斥,运维团队做容器化平台又在技术和资源上阻力重重。这种背景下,我们自己的基础架构进化之困难,可想而知。这也是为何我们希望把业界有指导意义的运维能力集中组织和分享出来,然后借助开源项目和社区把这种能力落实到更多的技术企业当中去。与此同时,我们也希望把知名开源社区上游的先进架构和技术视野融入到我们自己的技术体系当中,结合实际的实施案例,让我们国内的企业也拥有能够站在巨人肩膀上的机会。

这一次,我们相信运维、DevOps、SRE 一定会成为这次技术变革的主角。

毕竟,这本就是属于他们的时代。

福利

由 InfoQ 举办的 CNUTCon 全球运维技术大会将于 9 月 10-11 日在上海举办,12 位大牛联合出品,揭秘最前沿运维技术,更有阿里、百度、腾讯、京东、携程、搜狗等公司大牛分享他们在最新运维实践过程中遇到的坑与经验,点击“阅读原文”进入官网查看详情,篇幅关系此处不做过多展开。

最后,本文的读者在报名 CNUTCon 时输入 CNUTCon2017-InfoQ-YOUHUI 还可享受特别优惠,拿走不谢。7 折报名倒计时一周,欲购从速!购票咨询:

18504256269/hedy.hu@geekbang.org

关于作者

张磊,Hyper 项目成员,Kubernetes 项目官方 Project Manager 和 Feature Maintainer。曾任浙江大学研究员和课程讲师,期间组建浙大云计算团队(现为 CNCF 正式学术会员)并出版《Docker 容器与容器云》技术书籍,在 Docker 和 Kubernetes 开源社区均享有声誉。是微软“云计算与数据中心领域”最有价值专家、以及 LinuxCon、KubeCon 等多个国际会议的讲师。


感谢孟夕对本文的策划和审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-06-25 17:416492
用户头像

发布了 40 篇内容, 共 26.6 次阅读, 收获喜欢 142 次。

关注

评论

发布
暂无评论
发现更多内容

一些常用的hive sql函数

编程江湖

大数据 hive Hive SQL

喜报!Nocalhost 成功加入 CNCF 沙箱

CODING DevOps

Kubernetes DevOps cncf Nocalhost 本地化开发

Rainbond通过插件整合SkyWalking,实现APM即插即用

北京好雨科技有限公司

Kubernetes 云原生 全链路追踪

博文推荐|深入解析 Apache Pulsar 中的事务

Apache Pulsar

大数据 架构 分布式 云原生 Apache Pulsar

很好用的压测工具 - Apache Bench工具

恒生LIGHT云社区

测试 AB AB testing实战

安全经典JWT算法漏洞

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

百度:YOLOX和NanoDet都没我优秀!轻量型实时目标检测模型PP-PicoDet开源

百度开发者中心

目标检测 开源技术

聊聊 ab 和 jmeter 的并发模型

恒生LIGHT云社区

测试 AB

NDPQ(NDP+PQ),定义分布式数据库新方向

华为云开发者联盟

数据库 查询 GaussDB(for MySQL) 近数据处理 NDP

混合云管理策略是什么?如何又快又好的管理混合云?

行云管家

云计算 混合云 云管理

开源应用中心|程序员的崩溃瞬间,太形象了!

Java php 开源 插件

Linux一学就会之文件的基本管理和XFS文件系统备份恢复

学神来啦

Linux 运维 文件系统 linux云计算 linux基础

Python代码阅读(第65篇):根据条件应用指定函数

Felix

Python 编程 Code 阅读代码 Python初学者

从社区贡献者到加入核心团队,开源给他带来了这些变化

TDengine

tdengine 时序数据库

行云管家Proxy特点及其部署要求详细解析

行云管家

数据库 IT运维 行云管家 跳板机

前端开发之JavaScript优化

@零度

JavaScript 大前端

Google I/O 2021 What's new in Android Machine Learning

CatTalk

机器学习 tensorflow android Google

云原生数据库TDSQL-C关键技术内核解密

腾讯云数据库

tdsql 国产数据库

数据分析从零开始实战,Pandas读取HTML页面+数据处理解析

老表

Python 数据分析 数据处理 11月日更

万字讲解WiFi为何物

华为云开发者联盟

wifi 物联网 无线通信 传输 无线

Java开发中常用的消息队列工具 ActiveMQ

编程江湖

Activemq Java 开发

处理可能超时的异步操作

编程江湖

大前端

Google I/O 2021 移动和 Web应用上的设备端机器学习

CatTalk

机器学习 tensorflow android Google

一文讲透一致性哈希的原理和实现

万俊峰Kevin

微服务 高并发 哈希算法 go-zero Go 语言

大数据开发之Hive

@零度

大数据 hive

TDSQL | 国产化浪潮下,数据库+云如何跑上核心业务?

腾讯云数据库

tdsql 国产数据库

技术探究:Apache Pulsar 的事务型事件流

Apache Pulsar

Java 架构 分布式 云原生 Apache Pulsar

为云而生,云原生数据库TDSQL-C技术突破与演进

腾讯云数据库

tdsql 国产数据库

TDSQL演进与突破:把企业级分布式数据库做到极致

腾讯云数据库

tdsql 国产数据库

使用 Litho 改进 News Feed 上的 Android 视频表现

CatTalk

android facebook 性能优化 Feed流 Litho

Java SPI 机制从原理到实战

江璇Up

Java spi JavaSPI

从容器到运维,一篇文章看懂技术的变革与未来_语言 & 开发_张磊_InfoQ精选文章