写点什么

阿里巴巴 NLP 新进展:隔离场景噪音,提取清晰目标声音

  • 2018-12-03
  • 本文字数:773 字

    阅读完需:约 3 分钟

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音

阿里巴巴数据科学研究所(Alibaba Institute of Data Science)近期在进行一项研究,该项目希望在嘈杂环境下进行语音识别,比如在拥挤的地铁系统或会议中心里,通过隔离噪声,从而获得目标对象清晰的声音。


阿里巴巴的解决方案一部分依靠硬件,一部分靠软件:通过一个远场麦克风阵列和复杂的深度学习算法在人群中隔离声音,大幅降低错误率。


相比之下,“最好”的语音识别技术单靠麦克风阵列才能达到 84%的准确率,而阿里巴巴表示,他们的模式准确率在说话人口音很重的情况下,仍可以保持在 94%至 95%之间。据了解,这一技术已经被部署在上海的一个语音地铁售票系统中,阿里巴巴正在考虑将其推广到更多城市。


语音并不是阿里巴巴唯一研究的领域。利用自然语言处理,在云端实时执行自动翻译,让来自俄罗斯、马来西亚等国的阿里巴巴零售客户可以用母语与客服进行对话,也是阿里巴巴研究的项目之一。阿里巴巴的客服中心每天都会接到数以万计的呼叫,他们也正在利用算法处理其中的一部分工作,名为 Alime 的智能客户服务引擎就是这一研究的成果。


Alime 就像谷歌的 Duplex 系统一样,可以进行电话交谈,回答基本问题不需要人工参与。在聊天环境中,它还能够从客户提供的文档中自动提取文本和图像。


自然语言处理技术的应用只是阿里巴巴人工智能的冰山一角。在阿里的二手商品市场上,阿里巴巴部署了一款定价机器人,可以与买家谈判,以确定价格。


这款机器人的开发并非易事,它需要学习谈判策略和有效的生成文本的方法,以激励反复谈判。但最终取得的效果还是不错的:应用这款机器人的用户比其他人的成交率高出 20%。


该项目负责人表示:大多数用户不是专业卖家,不清楚应该如何定价,也不清楚如何与买家沟通,这款机器人可以很好地解决这个问题。


原文链接:


https://venturebeat.com/2018/12/02/alibabas-image-search-algorithm-can-recognize-up-to-300-million-objects/


2018-12-03 15:111479
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 279.9 次阅读, 收获喜欢 1301 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

【第七在线】智能商品系统和ERP、BI系统的区别

第七在线

软件测试/全日制测试开发/测试管理|如何制定合理的职业规划

霍格沃兹测试开发学社

数据讲述中国故事!和鲸助力中国综合社会调查(CGSS)数据分析与可视化大赛圆满收官

ModelWhale

人工智能 大数据 竞赛 中国人民大学 人文社科

拼多多根据ID取商品详情原数据 API (pinduoduo.item_get_app_pro)在电商中的应用

技术冰糖葫芦

API

软件测试/测试开发全日制/测试内推|字节跳动岗位开放~

霍格沃兹测试开发学社

炸裂!「用嘴编程」的时代真的来了,席卷8000多家企业的Comate大升级

飞桨PaddlePaddle

人工智能 深度学习 编程语言

记一次JSF异步调用引起的接口可用率降低

京东科技开发者

阿里云计算平台大数据基础工程技术团队直聘!!!

阿里云大数据AI技术

康威定律:AI时代的IT组织变革

FinClip

智能商品系统如何协同其他系统共享数据和优化供应链决策?

第七在线

Java药物不良反应ADR智能监测系统源码

源码星辰

Java 源码 ADR智能监测系统

mybatisplus推荐用法

meacial

分层架构 设计原则 开发规范 MyBatisPlus

【推文】企业级AI问答知识库训练营,火热开营中!

阿里云大数据AI技术

【大型模】模型型飞跃升级—文档图像识别领域迎来技术巨变

颜淡慕潇

ChatGPT OCR技术 垂直大模型 图像识别模型

软件测试开发/全日制/测试管理/人工智能丨如何合理制定职业规划

测试人

软件测试

软件测试/人工智能/全日制测试开发|利用ChatGPT自动生成自动化测试脚本

霍格沃兹测试开发学社

未来招聘更难?用友大易招聘云助力企业面对未来更从容

用友BIP

智能招聘

喜讯!尚思卓越再次入选数据安全创新能力全景图谱

尚思卓越

数据安全

找软件开发公司做软件,三种付款比例,降低支付风险

软件开发-梦幻运营部

shell脚本中注意事项详解。

百度搜索:蓝易云

Linux 运维 Shell 云服务器 ECS

每日一题:LeetCode-139. 单词拆分

Geek_4z9ami

Go 面试 算法 LeetCode 动态规划

Navicat Premium 15 mac(数据库开发软件)v15.0.30完美激活版

mac

苹果mac Windows软件 Navicat Premium 15 数据库开发软件

Typora for Mac(Markdown文本编辑软件) 1.7.6完美激活版

mac

Typora 苹果mac Windows软件 Markdown编辑软件

“用友-旭阳数智化联合团队”荣获“2023数字化践行者基石奖”

用友BIP

企业数智化

Java爬虫与Python爬虫有什么区别

百度搜索:蓝易云

Java Python Linux 运维 云服务器

VRRP协议是什么?详解它的工作原理

百度搜索:蓝易云

云计算 Linux 运维 云服务器 VRRP

不是每个企业都要数字化转型,但是每个企业都要进行数字化升级!

天津汇柏科技有限公司

数字化转型

阿里巴巴NLP新进展:隔离场景噪音,提取清晰目标声音_AI&大模型_KYLE WIGGERS_InfoQ精选文章