最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

钉钉音视频算法开放升级:远场拾音等技术被应用于多款生态硬件产品

钉钉开发者

  • 2023-07-20
    北京
  • 本文字数:1558 字

    阅读完需:约 5 分钟

钉钉音视频算法开放升级:远场拾音等技术被应用于多款生态硬件产品

7 月 19 日,钉钉音视频在 InfoComm 北京展会上公布最新生态开放进展:截至目前,硬件生态合作伙伴已突破 70 家,认证品牌达 50 家,认证硬件已超过 250 款,覆盖会议大屏、分体式设备、视频会议一体机、USB 音视频外设等。基于钉钉音视频的算法开放新策略,远场拾音、智能导播、智能音频算法等技术已被应用在英特尔、影石 Insta360、创通联达等硬件厂商的多款生态硬件中。


此外,钉钉会议的一系列产品升级也集中亮相,通过融入AI技术,为用户、生态伙伴提供更智能、高效的云会议产品,新增功能包含:会议智能纪要、对话控制会议操作、对话生成虚拟背景等。

音视频生态持续扩大,亿联、新华三等品牌加入钉钉朋友圈


钉钉音视频朋友圈再扩容,亿联、新华三等品牌加入,目前合作伙伴数量已突破 70 家。


InfoComm 现场,钉钉联合 TCL、鸿合、Insta360、联想等 30 多家行业领先硬件品牌联合展示了软硬一体的视频会议解决方案,其中也包含与 MAXHUB、罗技、Jabra 等硬件厂商发布的多款钉钉会议 Rooms 专款解决方案,让人与人、会议室与人、会议室与会议室之间的协作更加高效。



去年 3 月,钉钉音视频就宣布硬件全面生态化,面向生态开放音视频的五大认证体系,包括 Rooms 认证、Sip 认证、钉闪会认证、模组认证、外设认证。除了基础的认证合作,钉钉音视频也在持续发掘用户与生态伙伴的更深层次需求,逐步开放自己最核心的音视频算法与工程化能力,与硬件伙伴做产品共创,这是钉钉音视频生态开放的更进一步。

音视频开放算法已商用落地,远场拾音等技术被应用于多款生态硬件


在 InfoComm 展会上,钉钉音视频事业部负责人赵加雨介绍,目前钉钉的音视频开放算法已商用落地,远场拾音、智能导播、智能音频算法等技术已被应用于英特尔、影石 Insta360、创通联达等厂商的合作硬件产品中。钉钉将这些核心技术原子化后,以算法、软件、硬件、整机等多种方式向产业链伙伴开放,联合打造体验更佳的软硬一体视频会议产品。对于企业来说,则可以根据预算、使用习惯、会议室规模,灵活采购不同的解决方案,享受更智能的音视频会议体验。


视频会议行业这几年经历了很大的变化。随着企业恢复线下办公、混合办公成为常态后,越来越多的硬件厂商加入到这一赛道中,音视频软硬一体解决方案也就成了行业市场的重要命题。



赵加雨表示,传统或跨行的硬件厂商想要进入视频会议行业,会受限于音视频应用对于音频质量、实时性、视频质量等方面的门槛制约。而此番钉钉音视频的开放升级,正是为了提供一个不仅开放流量、也开放技术的平台,与产业链硬件厂商优势互补,提升他们的产品能力,并降低视频会议行业的准入门槛,构建一个开放共赢的合作生态。

视频会议融入 AI,升级推出会议智能纪要、对话控制会议操作能力


面向 AI 时代,钉钉视频会议率先将最新的 AI 大模型能力落地于开会协作场景,后续可通过唤起“/”斜杠智能助手,实现一系列智能化的功能,比如:



  • 升级钉钉闪记功能,不仅能生成一份含速记、音频和视频画面的完整会议纪要,自动整理摘要与代办,还能将录制内容智能分章节、分发言人,方便用户一键回顾定位。此外,钉钉闪记不仅可以在会后帮用户做总结,在会中也可以一键唤起,为用户总结前面大家讨论的内容,让后加入会议的成员快速了解会议讨论的背景;


  • 推出对话控制会议操作功能,用户通过自然语言就能完成各种指令,比如让智能助理帮你投屏、开美颜、设置全员静音等,无需再关心具体功能的入口。同时,用户还可以向智能助理提问,如“听不到声音、怎么加人、等候室怎么使用”,降低产品的使用门槛;


  • 推出对话生成虚拟背景功能,引入大模型文生图能力,通过自然语言帮助用户生成个性化虚拟背景,提升开会氛围。


赵加雨表示,作为目前中国最多人使用的视频会议产品之一,钉钉音视频将始终致力于实现企业、用户全面数字化的工作方式,利用新的技术拓展新的场景,并通过更深层次的开放策略推动音视频行业、产业链的升级发展。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-07-20 10:402784

评论

发布
暂无评论
发现更多内容

音视频大佬离职后,我是如何在短时间内在音视频开发做出一个性价比高的最优方案

擎声科技

开发者 RTC sdk 实时音视频 擎声Qtt

头脑风暴:完全平方数

HelloWorld杰少

算法 LeetCode 数据结构, 8月月更

EMQX企业版正式上架华为云OSC,助力企业实现云原生MQTT Broker的全生命周期管理

EMQ映云科技

物联网 华为云 mqtt emqx 8月月更

iofod - 为攻城师们打造的低代码平台

iofod jude

低代码 实用工具

兼容认证|天融信太行云与观测云完成产品兼容性互认证

观测云

排查 log4j2 安全漏洞的一次经历

观测云

【LeetCode】设计有序流Java题解

Albert

LeetCode 8月月更

大数据培训中心哪家比较靠谱

小谷哥

Apache Doris 助力网易严选打造精细化运营 DMP 标签系统

SelectDB

数据分析 OLAP Doris 多维分析 DMP

灵感宝盒图谱全新改版!代码实验室开启报名丨RTE NG-Lab 双周报

声网

人工智能 RTE NG-Lab

故障复盘后的告警如何加出效果?浙江移动等老司机总结了6条注意事项

TakinTalks稳定性社区

个推漫话数据智能 | 《天才基本法》中的贝叶斯网络及原理解读

个推

人工智能 机器学习 深度学习 算法模型

Seata-php 入门与下半年展望

apache/dubbo-go

科创板的一束“海光”,正在让中国半导体发展之路更清晰

脑极体

15条建议,把技术成果写成一篇高质量学术论文

阿里技术

经验分享

开源一夏 | 使用 CSS 的仿 GitHub 登录页面

海拥(haiyong.site)

开源 8月月更

重新定义容器化 Serverless 应用的数据访问

阿里巴巴中间件

云计算 阿里云 Serverless 容器 云原生

LeaRun.Java微服务快速开发平台

力软低代码开发平台

攻克美颜、虚拟背景、眼神接触多个难题,腾讯会议技术领先的秘诀找到了

科技热闻

Jedis 客户端

武师叔

8月月更

<T>和<?>区别

六月的雨在InfoQ

开源 T 8月月更

【数独 1】不回溯,试试候选数法1ms高效解数独谜题-C++实现

清风莫追

8月月更

政企组织为什么更需要私有化的IM即时通讯平台?

WorkPlus

Gartner:云安全面临的三大挑战以及三个对应策略

WorkPlus

如何开发一款基于 Vite+Vue3 的在线表格系统(上)

葡萄城技术团队

Vue 前端 vite 框架 系统开发

Tapdata 与麒麟软件完成兼容性互认证,国产化生态布局再跃步

tapdata

Tapdata Tapdata架构

当云走向行业垂直化,企业该如何应对?

WorkPlus

自研发RTC退退退!接入第三方RTC才是真的香

擎声科技

RTC 实时音视频 社交APP出海 泛娱乐出海 擎声Qtt

一文讲透研发,SRE,运维,DevOps 的区别

Bytebase

DevOps SRE dba database

融云 | 企业通讯录的设计与实现

融云 RongCloud

通信 企业

合并两个有序单链表,对象析构这一着我实在没想到。

清风莫追

8月月更

钉钉音视频算法开放升级:远场拾音等技术被应用于多款生态硬件产品_自然语言处理_InfoQ精选文章