QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来

  • 2023-12-08
    北京
  • 本文字数:882 字

    阅读完需:约 3 分钟

大小:461.05K时长:02:37
英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来

QCon 全球软件开发大会,将于 12 月在上海召开。英特尔软件与先进技术事业部 / 首席工程师胡宁馨将发表题为《WebNN,Web 端侧推理的未来》主题分享,探讨 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。


胡宁馨,就职于 Intel 软件与先进技术事业部,专注于 Web 技术,W3C 机器学习工作组 Web Neural Network API (WebNN) 规范的发起者和联合编辑,Chromium 项目 Code Committer,WebNN 模块负责人。他在本次会议的演讲内容如下:


演讲:WebNN,Web 端侧推理的未来


AI PC 以及 AI Mobile 的新兴时代已经到来,越来越多的设备集成了强大的神经处理单元 NPU,以实现高效的人工智能加速,这对需要端侧推理的应用至关重要。除了通过 CPU 和 GPU 进行推理之外,Web Neural Network API (WebNN) 提供了 Web 应用访问此类专有 AI 加速器 NPU 的途径,以获得卓越性能及更低功耗。


本次演讲将会给大家分享 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。作为 JavaScript ML 框架的后端,WebNN 将会在几乎不更改前端代码的前提下,为 Web 开发者及他们的产品带来相较于 Wasm,WebGL 更为优异的性能体验。


演讲提纲:


  1. 当前 Web AI 发展概况

  2. 主流硬件加速器的发展(CPU,GPU,NPU)

  3. WebNN 设计与架构

  4. WebNN 代码演示

  5. WebNN 浏览器(Chromium)实现

  6. WebNN 机器学习框架集成(ONNXRuntime 和 TensorFlowLite)

  7. WebNN Transformers 支持

  8. WebNN 性能


听众收益点:


○ 了解 Web 平台对异构处理器的支持

○ 了解基于 Web 的机器学习模型硬件加速

○ 了解 Chromium 实现内部细节


除上述演讲外,QCon 上海还将围绕 GenAI和通用大模型应用探索AI Agent 与行业融合应用的前景LLM 时代的性能优化智能化信创软件 IDE面向人工智能时代的架构性能工程:提升效率和创新的新方法等专题进行交流。


QCon 上海 2023,相约 12 月! 现在购票,享 9 折优惠,立减¥680!咨询购票请联系:18514549229(微信同手机号)。



2023-12-08 11:3011047
用户头像

发布了 89 篇内容, 共 46.4 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容
英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来_架构_徐晓博_InfoQ精选文章