写点什么

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

  • 2024-02-21
    北京
  • 本文字数:1127 字

    阅读完需:约 4 分钟

大小:595.73K时长:03:23
AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

ElevenLabs,一家 AI 语音克隆初创公司,最近推出了一项创新技术,旨在为视频内容添加逼真的声音效果。这项技术特别针对那些缺乏声音背景的视频,类似于早期的默片。想象一下,就像 1895 年路易斯·卢米埃尔导演的《火车进站》一样,原本静默无声的场景,现在可以通过 AI 技术增添生动的声音,从而为观众带来更加丰富的观影体验。


ElevenLabs 利用文本到音效的模型,通过简单的文字提示,比如“海浪撞击”、“金属铿锵声”或“鸟鸣声”,就能生成相应的声音,并将其叠加到视频上。他们最近发布的一分钟预告片展示了这一技术的能力,不仅包括城市背景下的脚步声、海浪声、火车的咔哒声,甚至还有未来机器人的机械声和好莱坞风格的宣传片人声,所有这些都是通过文本提示生成的。


ElevenLabs 的这项新技术,虽然还未正式发布,但已经预示着它将为内容创作者提供一个全新的工具,使他们能够为原本无声的视频片段添加丰富的声效,包括脚步声、波浪声和氛围声等。这不仅为 AI 生成的内容开辟了新的领域,也为任何需要背景音效的视频,如 Instagram 视频、商业广告或视频游戏预告片等提供了无限可能。


不过,要生成准确的模拟效果并不是件容易的事,需要系统同时对文本和视频像素进行学习,以精确映射视频和音频之间的关系。这项技术的发展受到了包括英伟达 AI 科学家 Jim Fan 在内的业界专家的关注,他们认为,要完美模拟声效,需要考虑许多因素,这还是非常有挑战的。


活动推荐:

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 即将于 5 月 17-18 日举行。这是一场主要面向工程师、产品经理、数据分析师的大模型会议,会议聚焦大模型训练与推理、AI agent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、大模型应用互动展演等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。


目前已确认出席嘉宾:

林咏华,北京智源人工智能研究院,副院长兼总工程师

谢剑,百川智能,技术联合创始人

余锋(褚霸),蚂蚁集团,蚂蚁超级计算部负责人,专题出品人

张佶,阿里巴巴,通义实验室 NLP 资深算法专家

杨萍,字节跳动,Code AI 团队技术负责人

李鑫 博士,科大讯飞,AI 研究院副院长、科研部部长

郭瑞杰,阿里巴巴,总监

陈祖龙,阿里巴巴,企业智能算法负责人

杨浩 博士,华为,文本机器翻译实验室主任

张科,蚂蚁集团,AI Infra 负责人

孟二利,小米,AI 实验室机器学习团队技术主管,专题演讲嘉宾

崔慧敏,中科加禾,创始人 & CEO

汪晟杰,腾讯,资深产品经理

陈鸿,蚂蚁集团,资深算法专家

陶万杰,马上消费金融,算法总监

季超,科大讯飞,人形机器人总负责人


更多精彩议题上线中... 详细内容可点击这里查看。

2024-02-21 14:174862

评论

发布
暂无评论
发现更多内容

张海宁:首个 CNCF 中国开源项目 Harbor 的修炼之道

腾源会

开源 腾源会

报名直达丨HarmonyOS开发者创新大赛线下城市交流会来了,约吗?

HarmonyOS开发者

HarmonyOS 交流 创新大赛

ko在数栈中的应用

袋鼠云数栈

80%的软件环境管理问题,根因都在这里 | 研发效能提升36计

阿里云云效

阿里云 DevOps 云原生 持续交付 部署

java培训:JVM垃圾回收

@零度

JVM JAVA开发

Nebula Graph 源码解读系列|客户端的通信秘密——fbthrift

NebulaGraph

数据库 图数据库

本着什么原则,才能写出优秀的代码?

AlwaysBeta

程序员 设计模式 代码规范

Kotlin语法手册(四)

寻找生命中的美好

android kotlin 安卓

高可用之SkybilityHA简单介绍-行云管家

行云管家

高可用 ha

阳振坤:从电动汽车看分布式数据库的发展和崛起

OceanBase 数据库

数据库 OceanBase 开源 OceanBase 社区版 HTAP

ModStart:拥抱新技术,率先支持 Laravel 9.0

ModStart开源

网络安全:SQL 注入漏洞

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

大数据培训:Flink CDC 高频面试题

@零度

大数据 flink

Netty如何高效接收网络数据?一文聊透ByteBuffer动态自适应扩缩容机制

bin的技术小屋

网络编程 Netty nio 中间件 Java【

OBCE 认证第一人莅临直播间|助你快速拿下 OBCA & OBCP 证书

OceanBase 数据库

直播 OceanBase 社区版 OBCE

《数字经济全景白皮书》数字人民币篇 重磅发布

易观分析

数字经济 数字人民币

易观分析获评2021年度北京市专精特新“小巨人”企业

易观分析

易观新闻 “小巨人”企业

直播系统聊天技术(七):直播间海量聊天消息的架构设计难点实践

JackJiang

网络编程 即时通讯 IM 直播技术 音视频技术

福建省福州市网络安全等级测评机构名单目录看这里!

行云管家

等保 等级保护 等保测评

手把手教学电瓶车进电梯检测、多类别车辆追踪、异常行为检测产业级应用

百度开发者中心

一文了解如何源码编译Rainbond基础组件

北京好雨科技有限公司

Kubernetes PaaS rainbond

SQL注入-“错误”的语句为什么会得到“正确”的结果?

BUG侦探

MySQL 网络安全 SQL注入

2022年2月国产数据库排行榜:冠军宝座面临挑战,OceanBase 重返 TOP3

墨天轮

数据库 tdengine TiDB 国产数据库

MatrixOne 0.2.0 发布!最快的SQL计算引擎来了!

MatrixOrigin

开源 MatrixOrigin MatrixOne 超融合异构云原生数据库 矩阵起源

MatrixOne 0.2.0性能测试报告

MatrixOrigin

开源 MatrixOrigin MatrixOne 超融合异构云原生数据库 矩阵起源

如何在设计时保证RPA机器人的稳定运行?

金小K

学生管理系统架构设计文档

阿卷

架构实战营

netty系列之:EventLoop,EventLoopGroup和netty的默认实现

程序那些事

Java Netty nio 程序那些事 2月月更

前端培训:Vue3计算属性比普通函数好的原因

@零度

Vue 前端开发

腾讯云联合信通院发布《超低延时直播白皮书》,推动直播延时降低90%以上

科技热闻

技术干货 | WebRTC ADM 源码流程分析

网易云信

音视频

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音_AI&大模型_李忠良_InfoQ精选文章