QCon 全球软件开发大会,将于 12 月在上海召开。英特尔软件与先进技术事业部 / 首席工程师胡宁馨将发表题为《WebNN,Web 端侧推理的未来》主题分享,探讨 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。
胡宁馨,就职于 Intel 软件与先进技术事业部,专注于 Web 技术,W3C 机器学习工作组 Web Neural Network API (WebNN) 规范的发起者和联合编辑,Chromium 项目 Code Committer,WebNN 模块负责人。他在本次会议的演讲内容如下:
演讲:WebNN,Web 端侧推理的未来
AI PC 以及 AI Mobile 的新兴时代已经到来,越来越多的设备集成了强大的神经处理单元 NPU,以实现高效的人工智能加速,这对需要端侧推理的应用至关重要。除了通过 CPU 和 GPU 进行推理之外,Web Neural Network API (WebNN) 提供了 Web 应用访问此类专有 AI 加速器 NPU 的途径,以获得卓越性能及更低功耗。
本次演讲将会给大家分享 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。作为 JavaScript ML 框架的后端,WebNN 将会在几乎不更改前端代码的前提下,为 Web 开发者及他们的产品带来相较于 Wasm,WebGL 更为优异的性能体验。
演讲提纲:
当前 Web AI 发展概况
主流硬件加速器的发展(CPU,GPU,NPU)
WebNN 设计与架构
WebNN 代码演示
WebNN 浏览器(Chromium)实现
WebNN 机器学习框架集成(ONNXRuntime 和 TensorFlowLite)
WebNN Transformers 支持
WebNN 性能
听众收益点:
○ 了解 Web 平台对异构处理器的支持
○ 了解基于 Web 的机器学习模型硬件加速
○ 了解 Chromium 实现内部细节
除上述演讲外,QCon 上海还将围绕 GenAI和通用大模型应用探索、AI Agent 与行业融合应用的前景、LLM 时代的性能优化、智能化信创软件 IDE、面向人工智能时代的架构、性能工程:提升效率和创新的新方法等专题进行交流。
QCon 上海 2023,相约 12 月! 现在购票,享 9 折优惠,立减¥680!咨询购票请联系:18514549229(微信同手机号)。
评论