写点什么

英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来

  • 2023-12-08
    北京
  • 本文字数:882 字

    阅读完需:约 3 分钟

大小:461.05K时长:02:37
英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来

QCon 全球软件开发大会,将于 12 月在上海召开。英特尔软件与先进技术事业部 / 首席工程师胡宁馨将发表题为《WebNN,Web 端侧推理的未来》主题分享,探讨 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。


胡宁馨,就职于 Intel 软件与先进技术事业部,专注于 Web 技术,W3C 机器学习工作组 Web Neural Network API (WebNN) 规范的发起者和联合编辑,Chromium 项目 Code Committer,WebNN 模块负责人。他在本次会议的演讲内容如下:


演讲:WebNN,Web 端侧推理的未来


AI PC 以及 AI Mobile 的新兴时代已经到来,越来越多的设备集成了强大的神经处理单元 NPU,以实现高效的人工智能加速,这对需要端侧推理的应用至关重要。除了通过 CPU 和 GPU 进行推理之外,Web Neural Network API (WebNN) 提供了 Web 应用访问此类专有 AI 加速器 NPU 的途径,以获得卓越性能及更低功耗。


本次演讲将会给大家分享 WebNN API 的 W3C 标准进度,对 CNN,Transformer 以及更广泛的生成式 AI (Generative AI) 模型的支持情况和计划,以及在 Chrome,Edge 等浏览器的实现进展。作为 JavaScript ML 框架的后端,WebNN 将会在几乎不更改前端代码的前提下,为 Web 开发者及他们的产品带来相较于 Wasm,WebGL 更为优异的性能体验。


演讲提纲:


  1. 当前 Web AI 发展概况

  2. 主流硬件加速器的发展(CPU,GPU,NPU)

  3. WebNN 设计与架构

  4. WebNN 代码演示

  5. WebNN 浏览器(Chromium)实现

  6. WebNN 机器学习框架集成(ONNXRuntime 和 TensorFlowLite)

  7. WebNN Transformers 支持

  8. WebNN 性能


听众收益点:


○ 了解 Web 平台对异构处理器的支持

○ 了解基于 Web 的机器学习模型硬件加速

○ 了解 Chromium 实现内部细节


除上述演讲外,QCon 上海还将围绕 GenAI和通用大模型应用探索AI Agent 与行业融合应用的前景LLM 时代的性能优化智能化信创软件 IDE面向人工智能时代的架构性能工程:提升效率和创新的新方法等专题进行交流。


QCon 上海 2023,相约 12 月! 现在购票,享 9 折优惠,立减¥680!咨询购票请联系:18514549229(微信同手机号)。



2023-12-08 11:3011019
用户头像

发布了 89 篇内容, 共 46.1 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

程序员口头禅:一张嘴就知道是青铜还是王者

高端章鱼哥

软件测试学习笔记丨JIRA-Bug管理流程定制

测试人

软件测试

开发大型体育赛事直播平台:现成源码解决方案有哪些功能

软件开发-梦幻运营部

用户研究之全面解析Persona

养心进行时

用户研究 用户行为分析 用户分析 用户画像 用户特征分析

李彦宏称创新不容易但不会放弃

Yan-英杰

#大模型

算法人生(17):从“课程学习”到“逐步暴露心理疗法”

养心进行时

人工智能 机器学习 AI 算法 #算法

海外云手机解决海外社交媒体运营难题

Ogcloud

云手机 海外云手机 云手机海外版 美国云手机 海外云手机推荐

了解AI长文本工具:Kimi Chat与ChatGPT区别对比

蓉蓉

ChatGPT Claude

IPv6监测指标有哪些?如何才算真正完成IPv6的升级改造?

国科云

共赴科技盛会“2024南京智博会”11月在南京国际博览中心召开

AIOTE智博会

南京智博会 物联网展 大数据展 智慧城市展

如何设计与构建 FinOps 流程、团队、体系与目标

阿里巴巴云原生

阿里云 云原生 FinOps

C++ 资源大全:标准库、Web框架、人工智能等 | 最全整理

不在线第一只蜗牛

c++ 人工智能 前端 Web框架

TikTok海外运营:云手机的四种快速变现方法

Ogcloud

云手机 海外云手机 云手机海外版 跨境云手机 tiktok运营

设备二维码怎么生成?三分钟即可搞定

草料二维码

二维码 二维码生成 草料二维码 设备巡检二维码 设备二维码

算法人生(16):从“K均值 & C均值”看“为人处事之道”

养心进行时

人工智能 机器学习 算法 K-Means #算法

XTransfer5月产研岗位热招

XTransfer技术

IPD是什么?如何组建 IPD(集成产品开发)团队?

IPD产品研发管理

产品 项目管理 研发管理 IPD

详解GaussDB(DWS)中的行执行引擎

EquatorCoco

Java 数据库 GaussDB

利用预训练模型优化大模型训练

百度开发者中心

人工智能 深度学习 大模型

C#实现多线程的几种方式

EquatorCoco

Java C# JVM

HTTP 报文详解

快乐非自愿限量之名

网络协议 网络 HTTP

6个步骤解析“用户运营”

养心进行时

运营 产品运营 用户分析 用户运营

The Battle of High-End Wi-Fi Chips: IPQ5322 vs. IPQ8072

wallyslilly

IPQ8072 ipq5322

VMware SD-WAN 6.0 发布 (含下载) - 领先的 SD-WAN 解决方案

sysin

vmware SD-WAN sdn SDN网络 velocloud

Swagger 中 allOf 的详细解读

Liam

程序员 后端 接口文档 API swagger

用户研究系列之“心流”解析

养心进行时

用户研究 心流 用户画像分析 用户特征分析 福流

软件测试学习笔记丨Spring Boot结合 Swagger 生成 API

测试人

软件测试 springboot swagger 测试开发

利用大模型训练提升AI性能

百度开发者中心

人工智能 大模型

阿里云可观测 2024 年 4 月产品动态

阿里巴巴云原生

阿里云 云原生 可观测

英特尔软件与先进技术事业部 / 首席工程师胡宁馨确认出席 QCon 上海,分享 WebNN,Web 端侧推理的未来_架构_徐晓博_InfoQ精选文章