QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

IBM 中国开发中心吉燕勇: 通过 Cloud Data Services 打造新型认知计算数据分析云平台

  • 2016-09-20
  • 本文字数:4127 字

    阅读完需:约 14 分钟

在今年初 IBM 首席执行官 Ginni Rometty 公开表示将向认知计算与云计算平台方向转型之后,尽管外界一致认为这一过程并不会轻松,但经过近半年时间的努力,IBM 确实已取得了一些进展,尤其是在中国国内,比如 IBM 重新整合了以新开发平台、云服务以及开源数据工具相结合的云数据服务体系,以及通过与世纪互联合作的方式实现了云数据库产品 Cloudant 的落地。那么在这些举措的背后,IBM 的真正目标是什么?IBM 转向云计算,又会对其用户以及整个行业带来哪些影响呢?为此 InfoQ 对 IBM 中国开发中心大数据及分析平台总经理吉燕勇进行了专访。

InfoQ:请先谈一谈您目前所负责的工作,以及之前的一些主要工作经历。

吉燕勇:在过去十几年当中,我一直在 IBM 中国开发中心工作,目前主要负责的工作是实现云上的大数据分析能力。IBM 中国开发中心是 1999 年成立的,专门负责开发 IBM 自己的核心产品。

2004 年之前,我主要负责电子商务及相关产品的开发工作。从 2004 年到 2010 年之间,在结构化数据方面,为了给国内众多银行用户提供更强的数据库方面的技术支持,我负责组建了 IBM 中国开发中心的数据库开发团队,另外在非结构化数据方面,企业内容管理开发团队同样也是我组建起来的。

到 2011 年的时候,因为 IBM 之前已经收购了 SPSS、Cognos 等公司,我又组建了业务分析团队,这样一来 IBM 中国开发中心大数据及分析平台的结构化数据团队、非结构化数据团队、以及分析团队就比较完整了。

近两年 IBM 的技术方向变化比较快,重点往认知计算、云平台方向发展。因此今年,我们就把负责云端开发的部门独立了出来,而我来负责所有大数据以及分析的云端开发工作。

另外因为市场对大数据人才的需求越来越强,我们从 2012 年开始就跟西安交大一起设立了一个 IBM 大数据分析专业,我同时也兼任着该系的主任一职。这就是我在 IBM 中国开发中心的主要工作经历。

InfoQ云端的数据处理能力,可以让企业更快速的进行实时数据分析,更便捷地访问、分享、管理企业自己的数据。我们知道 IBM 目前在这个领域中的产品服务组合被称为 Cloud Data Services,其中包含了一系列基于云的企业级数据分析管理工具以及相关服务,虽然 IBM 提出 CDS 概念的时间并不长,但我们能看到实际上 CDS 中的服务并不是新开发的。那么能否请您对那些不太熟悉这些服务的网友们介绍一下 IBM CDS 的整体架构吗?其中集成了哪些比较重要的产品和解决方案?

吉燕勇: IBM Cloud Data Services 涵盖了几乎全部的 IBM 核心大数据及分析技术能力,它可以分为五个方面,也就是数据库、数据分析、企业内容管理、数据集成、洞察服务。

IBM 之前收购了 The Whether Company,另外还与 Twitter 展开了合作,希望能够充分利用这些气象数据、社交数据方面的资源,更好地打造 IBM CDS 的洞察服务。所有这些技术能力,共同构成了 IBM 在云端的数据服务,也希望通过这些服务,能为用户带来更多的应用方式。

目前的 CDS 平台上的服务,更多是面向企业级用户的,这些服务以 24×7 的形式,不间断地为用户提供运维等方面的技术支持。同时,我们在打造 CDS 平台的过程中,也将整合大量开源的项目,把各种开源的资源充分利用起来,利用开源项目的优势更好地为用户提供技术服务。

InfoQ**:IBM Cloud Data Services中的大部分产品其实已经经过了很长时间的开发演进,已经成为了相对成熟的服务 **,那么能否请您介绍一下 CDS 的整个发展历程呢?对于 IBM 来说,CDS 的发展思路是怎样的?

吉燕勇:从整个 IT 行业发展的角度来看,在过去几年中已经非常明显地在向云计算、大数据、移动开发,甚至包括社交、安全等领域发展,这些其实都是行业转型的热点。

对于 IBM CDS 来说,我们更关注大数据和云计算两个方向。云计算提供了一种新的交付方式,它可以让企业把更多精力放在业务上。而大数据则可以挖掘出更多的商业价值。

IBM 从 2004 年开始就不断加大投入,花费了将近 200 亿美金,打造出了完善的、丰富的大数据分析能力。在过去,这些投资可能更多地会用于服务于传统的企业应用开发模式,而现在在这样一个开放转型的过程中,我们则希望能把 IBM 强大的结构化数据处理、非结构化处理、以及大数据分析的能力可以通过云服务来提供给企业用户,所以我们今年提出了被称为 Analytics Platform Services 的战略,并且专门成立了这样的一个部门,以收购来的 Cloudant 等产品为依托,希望能够打造出更好的 PaaS 方面的能力,让更多用户通过云端就可以使用 IBM 丰富的服务。

在今年初宣布向认知计算与云平台转型时,整个 IBM 的大数据分析部门也在向相同的方向转型,今后所有产品线的开发都将围绕着 APS 战略而进行,力图在 CDS 中将 IBM 最具优势的数据处理能力展现出来,这其实对于 IBM 来说也是一次重要的组织架构调整。

InfoQ在 IBM Cloud Data Services 的发展过程当中,遇到过哪些困难?应该如何去应对这些挑战?

吉燕勇:主要的挑战还是在于开发团队思维模式的转变上。过去十几年我们一直采用的是传统的本地开发模式,虽然同样的大数据分析,但毕竟不是基于云来进行开发。因此,在转型 CDS 的过程中,整个团队需要认真想清楚,我们的这些服务怎么迁移到云端,用户在云端是如何使用这些服务的,用户遇到问题时我们又该如何在云端提供技术支持等这些问题。所以在开发模式以及管理模式的转变上还是花费了相当多的时间的。

除此之外,在转型发展的过程当中,也涉及到了很多新技术的运用,也得到了新的积累,但相比较之下,这些技术上的困难还是比较容易解决的。

InfoQ您认为像 IBM Cloud Data Services 这样的服务平台,可以使哪些受众获益最多呢?

吉燕勇:数据现在已经变成企业最宝贵的资产之一,无论是企业 IT 人员,还是业务人员,都想利用数据来发掘更多的商业价值,他们都希望通过对数据的分析,能有所回报和收益。而 CDS 其实可以让企业中的所有角色都能获益。

对于企业中的业务人员来说,他们可以直接通过 CDS 里面一些服务和工具来获得具有预测性和指导性的分析能力,同时并不需要他们拥有 IT 专业知识,比如 IBM 刚刚在中国市场发布的基于云的认知计算与数据分析解决方案 Watson Analytics 就是这样的工具,业务人员可以很容易地获得业务洞察力并提升业务运营效率。

对于传统开发人员来说,同样也可以通过 CDS 这种基于云的一站式服务模式,迅速地获取常用的开发工具集合,提升开发速度。

对于传统企业里的 IT 管理人员来说,则可以通过云服务,结合自身内部的一些现有的解决方案,很快打造出一种混合式的服务出来,并让整个企业因此而获益。

对于目前在全球范围内谈得比较多的数据科学家来说,同样很有帮助。CDS 不但提供了大量开源工具与传统工具,还提供了很多独有数据的访问权,数据科学家可以在这样的环境中较快地开展工作。

InfoQ:目前在这个领域当中,同样也有其他的企业推出了相关的产品和服务,那么相比之下,您认为 Cloud Data Services 的不同的之处在于哪些方面?另外在帮助企业上云方面,它又能为企业带来哪些竞争优势呢?

吉燕勇:首先第一点,IBM 正在专注于将传统的数据服务转型为云服务。IBM 在大数据分析领域中经过长时间的内部研发与外部收购,已经形成了非常成熟的大数据分析产品线,因此现在为了适应新的转型趋势,而将 IBM 在大数据领域的技术优势转移到云上,以便更好地服务用户。

其次,IBM 希望通过云计算打造出一种面向企业的平台级服务,企业用户将可以得到全天候的技术支持服务。目前 IBM 是通过美国、英国、中国,三个地区的团队来提供 24x7 的企业级的服务,并对企业用户需求实现快速响应,为企业用户的业务连续性提供保障。

第三,IBM 一直非常支持开源,在 CDS 平台中,我们将 IBM 自行研发的大数据分析产品与开源项目整合到了一起,比如 Apache Spark cloud service。IBM 希望能将开源的特点,以及 IBM 在大数据领域的优势结合在一起,为用户打造一个比较完善的服务环境。

InfoQ您刚才提到了平台级的服务,那我们可以看到在 IBM Bluemix 上也提供了一些 IBM CDS 中的服务,您是否可以谈谈 IBM CDS 与 IBM Bluemix 的关系?这两个平台又是怎样合作为用户提供服务的?

吉燕勇:Bluemix 与 CDS 都是 IBM 推出的服务平台,IBM 一开始就在思考如何让这两者进行合作,如何能够让用户更方便、更快捷、更有效地去运用 IBM 的大数据分析能力。

Bluemix 比较侧重于面向开发者来提供服务,在开发过程中可以调用很多现成的服务以实现不同的功能。而 CDS 则是将大数据分析相关服务放到了 Bluemix 中,这样开发者就可以在 Bluemix 平台上直接调用 IBM 的数据分析与处理服务。

InfoQ您能谈一谈目前 IBM Cloud Data Services 的发展重心在于哪个方面吗?

吉燕勇:目前我们部门的重点工作还是在于开发和运维,实际上我们的团队正在负责为 IBM 全球用户提供运维支持,并实现不宕机的保障。这里运维工作可能跟传统的运维不太一样,它需要以一种创新、前瞻的思路来考虑可能出现的问题,比如如何能快速发现用户出现了技术问题,如何进行自动监控并处理好这些问题,同时还要和开发部门紧密合作,思考如何能把其他部门开发人员的服务快速通过 DevOps 上线,并解决遇到的问题。

IBM 今年整体要求所有部门都要把重心放在云上,IBM 中国区开发中心同样也不例外。

在重点研发工作上,IBM 中国其实正在扮演着非常重要角色,这其中也涉及到很多核心的专利技术,而这也是我的整个团队的核心价值所在。

InfoQ想请您谈一谈用户们都非常关心的服务落地问题,目前 IBM Cloud Data Services 中的产品和服务落地情况怎么样?未来还有什么规划?

吉燕勇:我们希望打造的服务平台,首先是要能把之前 IBM 的所有技术能力都放进来,接着让这些能力相互配合并形成一种整体式的服务。我们还准备加速研发,在数据科学以及机器学习等方面加强投入,让这个平台能够更加完善,能为全球用户提供服务。

关于服务落地,我们需要适应并遵从国家相关的数据安全法规。在此基础上,我们会加速 CDS 相关服务的落地,加大与本地企业的合作力度,利用我们团队的技术研发能力尽快解决落地过程中遇到的各种问题,不断推动服务落地的进程。

今年 5 月份通过与 21 世纪互联的合作,Cloudant 已经正式落地中国。而其他服务则将基于中国市场具体的用户需求,排出落地部署优先级,然后再一步步实现落地。

2016-09-20 21:061601

评论

发布
暂无评论
发现更多内容

分享:两年两度升级数据库,我们经历了什么

OceanBase 数据库

数据库 oceanbase

CCIG 2023 百度飞桨分论坛:大模型时代的图象图形技术变革与实践

飞桨PaddlePaddle

长三角生物医药产业加速跑,飞桨螺旋桨为创新药企、医药技术伙伴装上AI大模型引擎

飞桨PaddlePaddle

飞桨 生物医药

应用在虚机和容器场景下如何优雅上下线

华为云开源

微服务 云原生

【修复问题】HBuilder打包编译报错汇集(持续更新)

红泥

直播预告 | 博睿学院:全面升级自适应AIOps

博睿数据

可观测性 AIOPS 智能运维 博睿数据 博睿学院

【涨知识】PCB板为什么多是绿色的?

华秋PCB

PCB PCB电路板 电路板 PCB设计 显影

二层交换机和三层交换机到底区别在哪?

wljslmz

交换机 三周年连更

ScaleFlux压缩存储产品通过 PolarDB-PG社区版和PolarDB-X 开源版认证

ScaleFlux

开源数据库 数据压缩 数据库技术 企业数据

可计算存储技术全面升级CSD 3000存储体验

ScaleFlux

人工智能 机器学习 计算与存储 数据压缩

长三角生物医药产业加速跑,飞桨螺旋桨为创新药企、医药技术伙伴装上AI大模型引擎

飞桨PaddlePaddle

飞桨 科学计算 飞桨螺旋桨 文心生物计算大模型

QUIC协议在天翼云CDN全站加速产品中的应用

天翼云开发者社区

云计算 QUIC

今天开讲,6 大演讲主题、5 位技术大咖!龙蜥大讲堂 5 月精彩直播预告抢先看

OpenAnolis小助手

开源 操作系统 内核 龙蜥社区 龙蜥大讲堂

百度王海峰团队荣获吴文俊人工智能科技进步奖特等奖,成果已应用于文心一言

飞桨PaddlePaddle

一文读懂 DNS 解析

火山引擎边缘云

DNS 域名解析 火山引擎 边缘云

数据不只是数字:描述、分析、展示呈现数据的故事

Data 探险实验室

数据分析 数据 数据可视化 数字 可视化分析

RDMA网络实践

天翼云开发者社区

云计算 存储 RDMA

天翼云“息壤”荣膺第六届数字中国建设峰会“十大硬核科技”称号

天翼云开发者社区

云计算 算力 超算

PostgreSQL-HA 高可用集群在 Rainbond 上的部署方案

北京好雨科技有限公司

postgresql Kubernetes 云原生 rainbond 企业号 5 月 PK 榜

「MIAOYUN」:降本增效,赋能传统企业数字化云原生转型 | 36kr 项目精选

MIAOYUN

云原生 数字化转型 智能运维 降本增效 36氪

解决Centos7 yum 出现could not retrieve mirrorlist 错误

北桥苏

Centos 7 linux\

今日分享丨5分钟快速了解Containerd

inBuilder低代码平台

云原生

急吗?光急可没用呀!满满干货,两小时速成,别搁那干瞪眼了!

加入高科技仿生人

低代码 数字化 OA 数字转型

基于 TiDB + Flink 实现的滑动窗口实时累计指标算法

PingCAP

MySQL 数据库 开源 分布式 TiDB

极狐(GitLab)重磅发布新产品「极狐星」,让研发效能看得清,算得准,成就企业精英效能管理

极狐GitLab

DevOps 研发管理 研发效能 极狐GitLab 研发效能度量

解析内存中的高性能图结构

NebulaGraph

数据结构 图数据库

开源家装小程序

源字节1号

开源 软件开发 前端开发 后端开发 小程序发开

您的数据可以压缩吗?

ScaleFlux

存储成本 存储技术 数据压缩

2023高质量Java面试题集锦:高级Java工程师面试八股汇总

采菊东篱下

Java 面试

DPDK与ScaleFlux CSD 3000:金融数据处理的创新组合

ScaleFlux

DPDK 存储技术 数据压缩 金融开源

滋灌中小企业,分销伙伴和华为来做“送水人”

脑极体

分销

IBM中国开发中心吉燕勇: 通过Cloud Data Services打造新型认知计算数据分析云平台_数据库_刘羽飞_InfoQ精选文章