写点什么

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

  • 2024-02-21
    北京
  • 本文字数:1127 字

    阅读完需:约 4 分钟

大小:595.73K时长:03:23
AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音

ElevenLabs,一家 AI 语音克隆初创公司,最近推出了一项创新技术,旨在为视频内容添加逼真的声音效果。这项技术特别针对那些缺乏声音背景的视频,类似于早期的默片。想象一下,就像 1895 年路易斯·卢米埃尔导演的《火车进站》一样,原本静默无声的场景,现在可以通过 AI 技术增添生动的声音,从而为观众带来更加丰富的观影体验。


ElevenLabs 利用文本到音效的模型,通过简单的文字提示,比如“海浪撞击”、“金属铿锵声”或“鸟鸣声”,就能生成相应的声音,并将其叠加到视频上。他们最近发布的一分钟预告片展示了这一技术的能力,不仅包括城市背景下的脚步声、海浪声、火车的咔哒声,甚至还有未来机器人的机械声和好莱坞风格的宣传片人声,所有这些都是通过文本提示生成的。


ElevenLabs 的这项新技术,虽然还未正式发布,但已经预示着它将为内容创作者提供一个全新的工具,使他们能够为原本无声的视频片段添加丰富的声效,包括脚步声、波浪声和氛围声等。这不仅为 AI 生成的内容开辟了新的领域,也为任何需要背景音效的视频,如 Instagram 视频、商业广告或视频游戏预告片等提供了无限可能。


不过,要生成准确的模拟效果并不是件容易的事,需要系统同时对文本和视频像素进行学习,以精确映射视频和音频之间的关系。这项技术的发展受到了包括英伟达 AI 科学家 Jim Fan 在内的业界专家的关注,他们认为,要完美模拟声效,需要考虑许多因素,这还是非常有挑战的。


活动推荐:

AICon 全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展·2024 即将于 5 月 17-18 日举行。这是一场主要面向工程师、产品经理、数据分析师的大模型会议,会议聚焦大模型训练与推理、AI agent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、大模型应用互动展演等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。


目前已确认出席嘉宾:

林咏华,北京智源人工智能研究院,副院长兼总工程师

谢剑,百川智能,技术联合创始人

余锋(褚霸),蚂蚁集团,蚂蚁超级计算部负责人,专题出品人

张佶,阿里巴巴,通义实验室 NLP 资深算法专家

杨萍,字节跳动,Code AI 团队技术负责人

李鑫 博士,科大讯飞,AI 研究院副院长、科研部部长

郭瑞杰,阿里巴巴,总监

陈祖龙,阿里巴巴,企业智能算法负责人

杨浩 博士,华为,文本机器翻译实验室主任

张科,蚂蚁集团,AI Infra 负责人

孟二利,小米,AI 实验室机器学习团队技术主管,专题演讲嘉宾

崔慧敏,中科加禾,创始人 & CEO

汪晟杰,腾讯,资深产品经理

陈鸿,蚂蚁集团,资深算法专家

陶万杰,马上消费金融,算法总监

季超,科大讯飞,人形机器人总负责人


更多精彩议题上线中... 详细内容可点击这里查看。

2024-02-21 14:174850

评论

发布
暂无评论
发现更多内容

前端 JavaScript 实现一个简易计算器

编程三昧

JavaScript 大前端 代码实现

浅谈云上攻防——Web应用托管服务中的元数据安全隐患

腾讯安全云鼎实验室

安全攻防 云安全 元数据 网络攻防

边界防御·信息安全保密圈的 “丈八蛇矛”

郑州埃文科技

Ubuntu Server 20.04搭建zookeeper集群

玏佾

zookeeper 群集安装 搭建 zk 集群部署

打造中国数字军人 数军科技携黑科技亮相(北京)军博会

科技热闻

《持之以恒的从事运动》五

Changing Lin

7月日更

区块链技术在“三资”监管领域的应用

CECBC

生命科学领域新工具:北鲲云超算平台,梦启航的地方

北鲲云

百度程序员推荐的书籍,今天免费送!

百度Geek说

深入浅出 Gitalk 留言插件

悟空聊架构

开源 网站 7月日更 网站建设 留言

禾木之变:2021我们该如何持续拥抱AI?

脑极体

推荐系统的价值观(三十二)

Databri_AI

价值观 推荐系统

从零开始学习3D可视化之摄像机

ThingJS数字孪生引擎

大前端 可视化 数字孪生

隔壁工程师都馋哭了我的逆向工程IDA,说要给我搓背捏脚

网络安全学海

网络安全 信息安全 渗透测试 漏洞分析 逆向工程

讨论 | 低代码能解决制造业企业数字化转型所面临的问题吗?

优秀

低代码

Linkflow CDP亮相GDMS全球数字营销峰会

Linkflow

CDP 用户画像 数字营销

自建开发工具系列-Webkit内存动量监控UI(一)

Tim

FrontEnd 调试工具 Webkit 工具UI

第一周作业-对比不同公司产品招聘JD

小夏

产品经理训练营 邱岳

《面试八股文》之kafka21卷

moon聊技术

kafka 面试

我看 JAVA 之 并发编程【一】FutureTask & Callable

awen

Java 多线程 Callable FutureTask

Demo

Command

#架构实战营

爱奇艺奇秀直播的秒播体验优化实践

爱奇艺技术产品团队

直播 优化

为什么公司应该效仿开源的文化

BeeWorks

详聊微服务观测|从监控到可观测性,我们最终要走向哪里?

尔达Erda

开源 微服务 云原生 APM PaaS

架构实战营模块8作业

Geek_649372

架构实战营

你的直观感受有可能是错的

石云升

学习 认知偏差 7月日更

面对大规模 K8s 集群,这款诊断利器必须要“粉一波”!

尔达Erda

开源 云原生 operator PaaS kubernete

5分钟速读之Rust权威指南(三十九)unsafe

wzx

rust

pha挖矿系统源码开发

获客I3O6O643Z97

区块链+ PHA矿机挖矿 PHA质押挖矿

模块八 - 设计消息队列存储消息数据的 MySQL 表格

华仔架构训练营

如何科学地系统地梳理出CDP的RFP?

Linkflow

AI 创投公司 ElevenLabs 推新模型,可文字生成各式语音_AI&大模型_李忠良_InfoQ精选文章