10 月 17 日下午,在由百度主办的 2019 年中关村论坛 · AI 时代的深度学习技术与应用创新论坛上,百度展示了其在深度学习方面的最新进展和成果,并详细介绍了百度深度学习平台飞桨及其产业实践。
深度学习框架是智能时代的操作系统
“深度学习开发与产业应用是一个复杂系统,百度开源开放了自主研发的深度学习平台飞桨,我们期待与软硬件领域各界一道,更好地把深度学习技术标准化、自动化和模块化,促进产业智能化“,百度 CTO 王海峰在致词中表示。
从代码到你我熟知的人脸识别、智能对话、个性推荐之间需要多少步?链条很长,但它的开端无疑是在深度学习平台。百度 CTO 王海峰博士曾将深度学习平台比作“所有人工智能应用的一个基础的底座”。在演讲中,他提到,在智能时代,深度学习框架向下对接芯片指令集,向上承接各种行业应用,起到了承上启下的作用,是“智能时代的操作系统”。从组网、训练、到预测,深度学习平台对底层语言和重要算法模型进行封装,极大降低了研发门槛,是典型的共性技术平台。
王海峰,百度首席技术官
百度深度学习平台飞桨已累计服务 150 多万开发者
论坛现场,百度 AI 技术平台体系执行总监吴甜介绍了百度在深度学习领域的布局及关键性成果。
吴甜表示,近期,百度在深度学习领域的一大重要突破是推出了基于知识增强的语义理解框架——ERNIE ,其具备可持续学习能力。目前 ERNIE 已经累计学习 13 亿+知识,包括 1500 万篇百科语料和词语实体知识、10 亿条网页搜索知识,700 万轮人类对话数据 ,2000 万组句子语义分析,3 亿组篇章结构关系。
ERNIE 能够快速提升工业应用效果,在智能问答召场景中,ERNIE 模型应用于问题分析和排序,召回率将提高 7%,CTR 预估相关性提高 2.7%,此外,ERNIE 模型可进行文本润色,文本准确率可提高 7.3%;在对话理解场景中,运用 ERNIE 模型能使得对话理解准确率提高 2%。
目前,深度学习技术的大规模产业化仍面临很大的挑战,在开发方面,深度学习模型复杂,开发效率低;工业级大模型训练难度大;在部署上,在不同的硬件设备、平台和系统上部署模型成本较高。吴甜表示,基于上述考虑,百度自主研发了深度学习平台飞桨。
据介绍,飞桨集深度学习训练和预测框架、模型库、开发套件、工具组件和服务平台等为一体。是一个开源开放、功能完备的产业级深度学习平台。
在核心框架层面,飞桨提供开发、训练和预测一整套的技术能力;支持自然语言处理、视觉、推荐和语音等工业级模型库;飞桨提供面向语义理解、目标检测、图像分割等任务的端到端开发套件,支持自动化深度学习、迁移学习、强化学习、多任务学习、联邦学习、图神经网络等的工具组件,及 EasyDL、AI Studio 等支持低门槛应用深度学习技术的多个服务平台。
吴甜介绍,飞桨具有四大优势:
开发便捷的产业级深度学习框架。飞桨深度学习框架采用基于编程逻辑的组网范式,支持声明式和命令式编程,可做到开发的灵活性和高性能,网络结构自动设计,模型效果超越人类专家,更方便普通开发者使用。
采用超大规模深度学习模型训练技术。飞桨突破了超大规模深度学习模型训练技术,实现了世界首个支持千亿特征、万亿参数、数百节点的开源大规模训练平台,攻克了超大规模深度学习模型的在线学习难题,实现了万亿规模参数模型的实时更新。
多端多平台部署的高性能推理引擎。飞桨兼容多框架、多平台、多操作系统,通过与华为麒麟 NPU 的软硬一体优化,实现了在推理速度上的提升。
产业级开源模型库。官方支持的多领域工业级模型开源开放,包括在国际竞赛中夺得第一的语言理解模型、视觉模型等,此外还开源开放了 200 多个预训练模型。
吴甜,百度 AI 技术平台体系执行总监
截止目前,飞桨深度学习平台已累计服务 150 多万开发者,仅在定制化训练平台上就有超过 6.5 万企业用户,发布了 16.9 万个模型。
现场,吴甜还发布了《百度大脑 AI 技术成果白皮书》,向业界展示百度大脑在过去一年里的技术演进。
评论