12 月 11 日,腾讯云大数据 AI 发布会在北京举行。腾讯云副总裁王龙,对过去一年的腾讯云数据智能布局做了整体回顾,对 2020 年云厂商的挑战与机遇做了解读。腾讯云 AI 产品总监刘黎春、腾讯云大数据技术总监雷小平,分别介绍了基于腾讯云的 AI、大数据产品的升级情况、新品发布。会后 InfoQ 编辑对他们进行了采访。
云 + 数据智能带来更好的产品服务
困难,是 2019 年人工智能投资市场的第一个关键词。根据亿欧智库发布的《2019 中国人工智能投资市场研究报告》显示,在投资频数方面,2019 年 1-5 月投资频数仅为 2018 年全年的 23.7%,预计 2019 年全年投资频数将继续回落,达到 2018 年全年的一半水平。在投资金额方面,较 2018 年单笔平均投资额的¥4.2 亿,2019 年 1-5 月单笔平均投资额为¥2.1 亿,下跌 50%。
从 2018 年开始,人工智能企业创业热潮趋缓。人工智能投资阶段由早期向中期转移,A 轮和 B 轮投资频数合计已超 2019 年 1-5 月总体比重的 75%。过去几年投资热潮涌现的 AI 企业,经过充分竞争已重新洗牌。在投资市场,资金逐渐向头部创企集中,在一些 AI 细分领域,有扎实基础支撑具有 AI 落地能力的企业将迎来更好的发展。
“随着时间的发展,最终那些真正能够产生价值的才会脱颖而出。在这点上,我一年多前维持这个态度,现在还是维持这个态度,我觉得这不是坏事,这是好事,AI 落地场景、能够产生价值的这些供应商得到更好的发展。对整个行业,对整个社会都是有利的。”王龙说道。
腾讯云副总裁 王龙
在 AI 技术本身,依赖于几个要素:好的数据、好的算法模型、高性价比计算框架,而目前真正技术上的困难,是这些要素的探索已经到达了瓶颈,各个厂商在这些方面的比拼也越来越透明化。王龙提到:“AI 领域的竞争由点到点竞争,已变为全面竞争,变成了 AI 整体解决方案是否能更好的满足客户需求的竞争。好的事情是,随着云计算的不断发展,云和 AI 结合起来才能大幅降低 AI 使用的成本,降低 AI 门槛的速率比颓势更快一些,这也是希望所在。”
“现在初学者,可能通过几个小时的培训课程,就可以获得自己的人脸识别,能够帮助更多人以更简单的方式进入 AI 领域进行构建、开发。我们就能找到更多的应用场景”,王龙补充道。
2012-2019 年 5 月中国人工智能私募股权投资市场整体状况
AI 应用走向精细化场景
在 AI 整体解决方案竞争上,王龙向我们展示了最新的腾讯云大数据 AI 产品布局。腾讯云全面丰富产品服务的同时,在 AI 细分领域图像智能、语音智能、语义智能都获得了显著的增长。
全面更新的腾讯云数据智能服务
在图像智能领域,基于腾讯优图、腾讯安平 AI 安全实验室、腾讯 AI Lab、微信开放平台等团队的技术支持,为开发者提供综合性的图像智能服务。其中,反换脸 AntiFakes 技术基于图像算法和视觉 AI 技术,实现了对图片或视频中的人脸真伪进行高效快速的检测和分析,鉴别图片中的人脸是否为 AI 换脸算法所生成的假脸,并对其风险等级进行评估,防止不法分子利用“变脸”实施电信网络诈骗。
AntiFakes 换脸甄别技术
在语音智能方面,通用语音识别能力已拥有很高的识别率,但特定企业场景下存在大量生僻名词,目前行业内通用识别的效果较差。腾讯云此次发布了语言模型自学习工具,通过添加企业典型业务对话场景下的字词句,自助提升特定场景下特定名词识别的准确率,从而让语音机器人、电话录音质检等行业的语音识别效果得到大幅提升。在语义智能方面,目前日均处理语句超过千亿条,强化和微信 Plato 图计算能力,将千亿级图计算带入级时代
在腾讯内部的一些特有应用场景探索上,微信、QQ、腾讯视频这些应用孵化出了一些特别的 AI 能力。如跨年龄识别,识别被拐儿童的能力。将这些内部孵化的 AI 能力反馈给社会,持续不断的孵化及对外输出,这有助于建立一个良好的 AI 生态环境。
降本增效是服务关键
在降低成本方面,我们知道云有 IaaS、PaaS 和 SaaS。在信息系统的构建中这些层级的占比是不同的,腾讯云会在每一层都要想办法去降低成本,比如 IaaS 层使用更多的异构架构,在计算这一层,优化每一个单位计算成本、单位存储成本、以及单位传输成本都力争做到业界最低。
对于在训练成本的降低方面,怎么让训练的速度能够做得更快,其实是现在很多做平台,云服务商都会去追求的事情,腾讯云与别的云服务商有什么不一样的地方?
腾讯云第一个提出 Model 助手的概念,他们会把很多腾讯云内部已经预训练好的语言模型,放到机器学习的平台上去,在很多的场景里面开发者不再需要一个模型重新再去做训练,拿语音预训练模型来说,重新去做一个预训练语音模型成本是非常高的。一个比较大规模的模型训练,如果是拿一个 200G 的语料训练一个 3 亿参数的 bert 模型,需要 1400 多张 V100 的 GPU,如果一次迭代算 53 分钟,跑 10 个迭代能跑出来效果,那就需要 530 分钟的时间。这对计算资源的耗费是非常大的。
腾讯云希望能够把预训练好的语言模型,以参与化的形式给到开发者、合作伙伴去使用,降低从头训练模型的成本,这个概念在业内是首次提出。腾讯云预训练好的语言模型,尽量能覆盖较多领域里的语料,各行各业都会被包含进来。开发者可以直接使用这个模型,与自己手上特定领域的样本相结合,在原来大的预训练模型基础上做一部分的微调,就能产生更优的效果。
“AI 落地”行业理解更重要
回到 2017 年,那时由于深度学习框架,算法理论上的突破再加上更好的数据,这三方面交汇在一起,形成了一个突破点。使得原先不可能使用 AI 的场景被开发出来了。当这个边界被打破后,大家一窝蜂的去尝试各种可能,这里面肯定是存在伪需求的,有的场景使用人工智能可能创造不了太多价值,甚至是亏本,为了人工智能而人工智能的也有很多。
人工智能到底在什么样的场景下能应用?刘黎春认为:“首先是这个场景他有自己的数据积累,积累了一定数量的数据。第二,在 ToB 这个领域有人力大量重复性劳动在,而且这个重复性的这个劳动是能够被机器学习出来的,规则或者是算法,能够通过人工智能去解决”。
比如说银行风控方面,一线客服人员进行房贷申请评估,这就是一个很典型的人工智能可以应用的场景,这个场景有大量数据的积累,银行是有很多的客户申请数据和客户申请完之后的表现数据,比如他有没有按时去还贷款,还款的能力和意愿怎么样。
在一线的客服人员也总结了很多的工单,客户会问什么样的问题,我遇到这个问题之后该怎么回答?,整理了一个问题和答案的知识库,有数据的积累。第二个是重复性的劳动,80%、90% 的用户都是问的相似的问题,并不是每次都很难的问题,一定要介入人工服务。这个时候数据挖掘的技术就在这个行业里很快得以应用。
在这一方面腾讯云大数据 AI,会深入行业了解行业痛点,给企业提供真正行而有效的解决方案。在企业的运行过程中,找出时间、人力、资金消耗最多的地方在哪里。经过分析找出 AI 能帮助它做什么。王龙表示:“随着技术的不断演进,企业进入数据智能领域、和使用数据智能的门槛将继续大幅降低。AI 落地靠一招鲜的时代已经过去,取而代之的是针对性的、场景化的、差异化能力,和能够最大化价值的端到端的、全面的解决方案。”
评论