内容作为媒介传播的主体,无论是在传统纸媒时代、PC 互联网、移动互联网还是以后的物联网、视联网,它依然具有强悍的生命力,内容为王永不过时。而文章、图片、视频、音乐等内容的生产,是个极其庞大的产业。过去内容生产一直被认为需要很强的创造性,因此主要由人来完成。
然而近两年飞速发展的人工智能(AI)已经逐渐渗透进了内容生产的各个环节,人工智能从事内容生产似乎已经没那么遥远。随着移动互联网时代的发展,信息传播的无限畅通使内容创作的诉求不断提高而门槛不断降低。人人皆可创作的新环境,同时也意味着内容创作的竞争空前加剧。此时,依靠 AI 实现的智能创作应需而生,科技巨头和创业公司开始纷纷发力,一个新的市场初见端倪。
腾讯智媒 内容生产平台
Smart Content Platform
基于对媒体发展的理解,多媒体实验室很早就在智能媒体方向上开始进行研究和尝试,同时打造的很多智能生产能力已经在实际项目中得到了很好的落地。基于相关的经验多媒体实验室打造了跨模态的腾讯智媒内容生产平台。平台可以将视频、音乐、文字、图片四种类型的素材进行有机的整合和转化,高效的生产各种类型的内容。
部分能力介绍
随着大家获取信息的方式大量的从浏览文字转为观赏视频,人们对优质视频内容的需求量与日俱增。简单的扩大编辑团队除了会显著增加成本以外,也很难稳定把控视频的质量。同时短视频的兴起带来了海量非专业人士制作 UGC 视频的需求,因此如何降低视频制作门槛简化制作流程成为了关键问题。基于人工智能技术,智能生产平台上的「视频智能剪辑」和「智能视频配乐」就可以很好的简化这个过程,甚至在某些场景下做到一键成片。
视频智能剪辑
视频智能剪辑基于多模态视频理解技术,将用户感兴趣或关键的片段进行剪辑、拼接、和理解。以体育精彩集锦为例:我们体育剪辑引擎先利用事件检测技术定位到视频的关键事件区间,将完整体育比赛视频拆分成若干片段;再利用时序动作识别技术对视频片段进行进一步理解;最后将以上信息进行筛选和融合,自动完成剪辑工作。以下足球视频即为系统自动剪辑生成。
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
智能视频配乐
智能视频配乐基于跨模态内容检索和标识技术,将合适的音乐内容或视频内容进行自动匹配,高效完成短视频创作。我们一方面基于智能内容检索技术,收集海量无监督的优质短视频素材,学习各模态的特征;另一方面基于内容标识技术,对不同类别的内容进行标签提取,通过标签在语义空间中的分布情况来进行素材的高效匹配。
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
音乐智能理解
音乐作为科学和艺术的交叉点,也是人工智能较晚走入的领域。通过不断的积累,智能生产平台在音乐领域也已经具备了十八般武艺。音乐智能理解基于多种音乐结构分析技术,通过对音乐全局结构和节奏等信息进行抽取和理解,自适应的获得音乐的鼓点以及高潮位置。同时提供音乐各章节的横向理解能力,以及区分人声、伴奏、贝斯等的纵向理解能力,可以便捷的在各类场景中使用。
图片/视频翻译
图片/视频描述基于时序特征翻译技术,将图片或视频中的视觉信息综合理解,生成对应的文字信息。我们的算法会将单帧的视频图像与视觉空间中的内容上下文进行综合理解;然后将获得的视觉信息转化为文字信息,经过一系列的优化生成贴切的文字描述。相关的能力可以应用在电商等场景中,快速自动化的生成商品介绍。
落地案例
目前智能内容生产平台已经服务于全民 K 歌、微视、企鹅号、腾讯视频、腾讯影业等众多产品,每天为海量腾讯 C 端用户提供优质内容。同时协同腾讯云发力 B 端,在传媒、文旅、政务等多个 ToB 行业中得到良好的应用。
头图:Unsplash
来源:腾讯多媒体实验室 - 微信公众号 [ID:TencentAVLab]
转载:著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
评论 1 条评论