写点什么

Facebook 发布神经蛋分离法,可从嘈杂环境中提取音视频

  • 2018-11-29
  • 本文字数:618 字

    阅读完需:约 2 分钟

Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频

分离混合分布是机器学习和信号处理的长期挑战,而 Facebook 近日提出的新方法似乎可以有效解决这一难题。


人类天生善于分离个别声音和视觉效果,例如在拥挤的鸡尾酒会上听到别人的声音,或者在动物穿过灌木丛时发现动物。但依赖于机器学习的应用程序通常很难完成这项任务。解决这一问题的监督方法,包括对每个来源的样本进行培训,以及假定大量的训练数据都不一定能取得很好的效果,完全无监督的方法会使模型对混合信号源做出不准确的假设。


于是 Facebook 的研究人员提出了神经蛋分离法(Neural Egg Separation,简称 NES),据官方解释,这一方法的命名灵感来源于鸡蛋,意思是像分离蛋清和蛋黄一样把清晰的音视频从模糊的信号中提取出来。


这是一种半监督方法,结合了训练和估计的各个方面。在这一迭代方法中,系统通过将信号混合在一起并进行多个分析来分离已知和未知分布。在此过程中,系统逐渐将更多已知信号注入混合信号中,同时模型在隔离和提取时不断改进。实验表明,NES 明显优于采用类似监督的其他方法,即使对使用全面监督的系统,NES 方法也具有竞争力。


除了改善 ML 系统在逼真的杂乱和嘈杂条件下理解音频和视觉输入的能力之外,这种方法还可以通过应用增强人们隔离信号的自然能力。比如,可以应用在音乐会(或类似场景)中的音频、视频记录,或者开发基于 AR 的应用,用来实时放大特定音频源或视觉特征。


论文地址:


https://research.fb.com/publications/neural-separation-of-observed-and-unobserved-distributions/


2018-11-29 15:261776
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 276.9 次阅读, 收获喜欢 1301 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

BEANZ NFT 概览与数据分析

Footprint Analytics

blockchain NFT

多种方式获取淘宝商品详情数据,关键词搜索商品列表,店铺ID获取店铺所有商品,按图搜索获取商品详情数据

Anzexi58

API 文档

立即报名|3 月 8 日北京,稳定性 & 可观测沙龙来了!

阿里巴巴云原生

阿里云 容器 微服务 云原生

小红书笔记详情API入门指南

技术冰糖葫芦

API 文档

SD-WAN网络中,CPE设备的重要性与选择

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

探索基于Stable Diffusion的智能绘画大模型

百度开发者中心

人工智能 深度学习 图像 大模型

WPF性能优化:性能分析工具

EquatorCoco

性能优化 服务器 WPF

比特币价格突破62000美元,近一个月涨幅超过40%

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

可用于智能客服的完全开源免费商用的知识库项目

不在线第一只蜗牛

架构 开源项目 技术栈 智能客服

大模型+搜索:构建完整技术栈,为企业定制化注入新活力

百度开发者中心

数字 大模型 人工智能、

电商卖家如何利用API获取用户行为数据

技术冰糖葫芦

API 文档 API 策略

J17资本合伙人SKY LAI确认出席Hack .Summit() 2024区块链开发者盛会

TechubNews

什么是渗透测试?有哪些类型?

小齐写代码

跳槽必看MySQL索引:B+树原理揭秘与索引优缺点分析

王中阳Go

数据库 面试 金三银四 跳槽

SD-WAN对云服务的影响

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

互联网大厂面试题解析之大疆一面

派大星

Java 面试题 互联网大厂面试

商用AI PC,能帮企业带来什么?

E科讯

使用ConfuserEx代码混淆工具保护你的.NET应用程序

EquatorCoco

.net 开源 应用程序 混淆

2024年金三银四Java初中高级面试1000问,覆盖一线大厂各种面试痛点

采菊东篱下

编程 程序员 java面试

L2 网络 Mint Blockchain 正式对外发布测试网

NFT Research

blockchain NFT 测试网络

用户使用433MHz无线模块时,出现偶尔无法收发数据的原因?

Geek_ab1536

抢占市场先机:利用API商品数据接口激活您的数据资产

Noah

IDC 中搭建 Serverless 应用平台:通过 ACK One 和 Knative 玩转云资源

阿里巴巴云原生

阿里云 云原生 容器服务

盘点6个最受欢迎的 Vue.js UI 库

秃头小帅oi

『双向奔赴,绿动未来』 ——能效电气2024新品发布会

Geek_2d6073

深度解析:Allure报告如何提升你的测试效率?

测试人

软件测试 自动化测试 测试开发

7万张H100打造的Open AI文生视频Sora功能原理详解|Sora注册全攻略

GPU算力

对比传统主机,云主机贵吗?是否值得购买?

一只扑棱蛾子

云主机

AI PC的风刮到企业里,看英特尔vPro怎么做到的

E科讯

SD-WAN技术:是挑战还是机遇?

Ogcloud

SD-WAN 企业网络 SD-WAN组网 SD-WAN服务商 SDWAN

国际盛会 | 蔚蓝创造亮相KEY ENERGY 2024能源展

科技热闻

Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频_AI&大模型_Facebook_InfoQ精选文章