一条条装载着乌黑闪亮煤块的传送带从井底向井上不停运转。在悠长、复杂的传输中,不时会突发危险事件——作业矿工意外跌入传送带,引发危及生命的事故;异物掉落在传送带上,将昂贵的传输带卡住、撑断……
煤矿管理人员特别需要实时、智能化的监控系统,帮助他们及时发现安全隐患,并快速响应。现在,基于人工智能的监控方案,能快速识别出传送带上的“非法入侵物”,及时将报警图片发送给指挥系统,管理者或系统会立即叫停传送带。
在矿井的井上和井下,还有许多类似的“安全禁地”。现在,安全监控智能系统正被快速复制到各个场景下,对安全事件进行识别、预警和响应。
不仅是煤矿,在很多工业企业都有着靠人工很难解决的问题。像水电站,当蓄水池水位达到一定高度时就需要及时开闸泄洪。不久前,一家水电站因为泄洪不及时,让下游两个村庄遭受水灾。这家水电站的管理者很头疼——怎样才能对 100 多米高的水坝中的水位进行准确预测,制定合适的泄洪时间表?
现在,基于人工智能的预测系统,通过学习过去 10 年甚至更长时间的庞大历史数据,包括水坝水位、降雨量、地表干燥度、气候变化等,来预测未来一段时间内的水位情况,精度可达厘米级,并给出恰当的泄洪时间点。
“人工智能、深度学习正在帮助我们解决靠人工很难突破的场景。”才云解决方案总监杜宁说。才云科技(Caicloud)已为上述工业企业提供基于人工智能的解决方案。
人人都能用的谷歌开源技术
才云科技是一家创业公司,成立于 2015 年,几位创始人来自谷歌和亚马逊。在他们中间,CEO 张鑫是谷歌集群管理组核心成员,曾管理谷歌世界级的数据中心和庞大的服务器集群;CTO 邓徳源是容器技术 K8 开源代码项目全球前十的代码贡献者;首席大数据科学家郑泽宇基于谷歌内部深度学习系统,提出产品聚类项目,用于衔接谷歌购物和谷歌知识图谱(Knowledge Graph)数据,开启在谷歌搜索页面投放谷歌购物广告的业务。
才云科技首席大数据科学家 郑泽宇
“创办才云很大的契机是当时 Kubernetes 技术开源。”郑泽宇说。Kubernetes 是谷歌集群管理系统的开源版,几个月后,谷歌又将其深度学习框架 TensorFlow 开源。这些开源技术能从底到上把云计算和大数据很好地融合。而才云的年轻人希望把谷歌技术分享给更多外部行业企业,让大家享受到技术福祉。
那么,才云怎样提供有价值的服务呢?它希望提供从底到上的整体解决方案——这更有助于大数据、人工智能技术落地。
原来,Kubernetes 开源版本仅提供核心技术——就像一个新鲜椰子,如果你没有工具,是喝不到壳中的椰汁的。于是,才云根据每家企业现有的硬件环境,把 Kubernetes 需要的计算、网络和存储资源对接好。之后,因为 Kubernetes 只能管理一个集群,才云为企业搭建“集群联邦”,实现企业多个环境,如开发环境、测试环境、不同子公司的一体化管理。这些服务帮助企业将 Kubernetes 容器技术落地。
再之后,在基础设施之上,TensorFlow 落地需要的工作就更重要了。TensorFlow 只是一个非常核心的工具包,它在生产环境中的稳定性,它的调度、监控、用户管理都还不完善。企业需要一个对 TensorFlow 设计理念有深入了解的团队,帮他们在生产环境中去落地。才云就提供这样的落地服务。
深度学习像当年的 Hadoop
为什么深度学习生态还不完善,这是因为深度学习在全球都还是新兴技术。“现在的 TensorFlow,有点类似于 2008 年的 Hadoop,是一个突破性技术,但需要付出学习成本。”郑泽宇说。
为了帮助大家去熟悉 TensorFlow,郑泽宇出版了第一部 TensorFlow 中文书,并与国内高校,如他的母校北大和一些培训机构合作推广 TensorFlow。
除了谷歌的 TensorFlow,大企业相继对自身的深度学习框架开源,包括亚马逊 MXNet、Facebook 的 Torch 以及百度的 PaddlePaddle,目的是竞争标准,瓜分火热的深度学习市场。
“我们选择 TensorFlow 很重要的原因,是底层环境的 Kubernetes 和上面的 TensorFlow 源自谷歌,因此它们也最融合。还有一个重要原因是 TensorFlow 在国内呼声最高,用户最广。”郑泽宇说,“你从出书的情况也能看出几分,TensorFlow 有 5 本中文书,Caffe 有一本,MXNet 我还没看到。”
据悉,谷歌已有上万个项目应用 TensorFlow。而在图像、机器人领域应用较多的 Caffe,广度上不如 TensorFlow。TensorFlow 的积累从 2011 年就开始了,比其他深度学习平台要早几年。
人工智能落地要定制化
目前,国内外大企业如谷歌、亚马逊、阿里云都在提供现成的 AI 产品,才云这类企业提供的开源 AI 落地服务还有价值吗?
“大企业提供的 AI 针对的是非常通用的场景。”郑泽宇说。如果企业的需求能归纳成通用需求,如要用 OCR(光学字符识别)识别纸上的文字,可以使用通用 AI 服务。但对于大部分具体行业中的具体场景,如在昏暗的矿井下识别异物,通用 AI 是肯定解决不了问题的。
“这就牵扯一个问题,为什么人工智能出来这么久,但落地不是特别好?这是因为人工智能是一种对定制化要求非常高的技术。”郑泽宇说,“至少在三五年内,在绝大部分场景下,通用人工智能提供不了帮助。人工智能一定要定制化才能落地。”
这就需要一批提供人工智能服务的企业,提供贴合企业场景的方案,把“智能”落地到业务中去——
他们要结合企业原有系统,构建从底层基础设施到上层人工智能算法的整套解决方案。这个过程要考虑与原有系统的兼容性,并与原有系统打通。
他们要针对特定行业和场景,如煤矿监控采集数据,训练模型算法。
他们还要通过深度学习,加速人工智能方案在不同场景下的迁移,降低成本。
郑泽宇解释说,在深度学习技术出来前,人工智能应用的场景非常专,迁移很难,甚至不大可能。有了深度学习,之前 AI 系统学习到的技能,可以成为新技能的基础。就像人们学会了普通话,再学一门方言要快得多一样,现在,才云人工智能技术处理一个新场景的时间是原来的 1/4 到 1/8,在 1 个星期到 1 个月之间,这更有利于人工智能落地。
聊出来的需求
除了要解决技术落地的挑战,郑泽宇他们遇到的另一个挑战,是找到企业可能的需求。“因为做技术比较久,怎么把技术与企业的痛点做一个结合,是件困难的事”。这也是他回国后做得最多的一件事。
郑泽宇发现,国内传统企业思想很开放,“都在向技术型企业转型”。他们会关注最新技术,希望利用新技术来解决他们的问题。一旦技术被证明能帮助他们解决问题,对他们的吸引力就很大。
“我现在的方法就是与搞业务的人多聊,了解他们最烦恼、最不方便的事,到处多看,这就是找需求的秘籍。” 郑泽宇说。
现在,才云团队正与一家火电厂探索节能降耗的解决方案。在谷歌,通过人工智能技术,监控调节数据中心制冷设备的运行参数,一年就能节省 6000 万美元。这样的应用理念正被搬到国内。
在这家火电厂,排烟温度每降低 1 度,就能节省 1000 多万元成本。如何降低排烟温度问题,靠人的经验很难解决。“我们利用深度学习,分析当发电机组的哪些阀门和传感器进行调整,可以把温度降下来。”杜宁说,目前项目正在进展中。
本文转载自才云 Caicloud 公众号。
原文链接:https://mp.weixin.qq.com/s/tSQatm5a4n2a47jJG3bOyA
评论