写点什么

智能内容生产,媒体的智能未来

  • 2020-12-28
  • 本文字数:1500 字

    阅读完需:约 5 分钟

智能内容生产,媒体的智能未来

内容作为媒介传播的主体,无论是在传统纸媒时代、PC 互联网、移动互联网还是以后的物联网、视联网,它依然具有强悍的生命力,内容为王永不过时。而文章、图片、视频、音乐等内容的生产,是个极其庞大的产业。过去内容生产一直被认为需要很强的创造性,因此主要由人来完成。


然而近两年飞速发展的人工智能(AI)已经逐渐渗透进了内容生产的各个环节,人工智能从事内容生产似乎已经没那么遥远。随着移动互联网时代的发展,信息传播的无限畅通使内容创作的诉求不断提高而门槛不断降低。人人皆可创作的新环境,同时也意味着内容创作的竞争空前加剧。此时,依靠 AI 实现的智能创作应需而生,科技巨头和创业公司开始纷纷发力,一个新的市场初见端倪。


腾讯智媒 内容生产平台


Smart Content Platform


基于对媒体发展的理解,多媒体实验室很早就在智能媒体方向上开始进行研究和尝试,同时打造的很多智能生产能力已经在实际项目中得到了很好的落地。基于相关的经验多媒体实验室打造了跨模态的腾讯智媒内容生产平台。平台可以将视频、音乐、文字、图片四种类型的素材进行有机的整合和转化,高效的生产各种类型的内容。



部分能力介绍


随着大家获取信息的方式大量的从浏览文字转为观赏视频,人们对优质视频内容的需求量与日俱增。简单的扩大编辑团队除了会显著增加成本以外,也很难稳定把控视频的质量。同时短视频的兴起带来了海量非专业人士制作 UGC 视频的需求,因此如何降低视频制作门槛简化制作流程成为了关键问题。基于人工智能技术,智能生产平台上的「视频智能剪辑」和「智能视频配乐」就可以很好的简化这个过程,甚至在某些场景下做到一键成片。


视频智能剪辑


视频智能剪辑基于多模态视频理解技术,将用户感兴趣或关键的片段进行剪辑、拼接、和理解。以体育精彩集锦为例:我们体育剪辑引擎先利用事件检测技术定位到视频的关键事件区间,将完整体育比赛视频拆分成若干片段;再利用时序动作识别技术对视频片段进行进一步理解;最后将以上信息进行筛选和融合,自动完成剪辑工作。以下足球视频即为系统自动剪辑生成。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    智能视频配乐


    智能视频配乐基于跨模态内容检索和标识技术,将合适的音乐内容或视频内容进行自动匹配,高效完成短视频创作。我们一方面基于智能内容检索技术,收集海量无监督的优质短视频素材,学习各模态的特征;另一方面基于内容标识技术,对不同类别的内容进行标签提取,通过标签在语义空间中的分布情况来进行素材的高效匹配。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      音乐智能理解


      音乐作为科学和艺术的交叉点,也是人工智能较晚走入的领域。通过不断的积累,智能生产平台在音乐领域也已经具备了十八般武艺。音乐智能理解基于多种音乐结构分析技术,通过对音乐全局结构和节奏等信息进行抽取和理解,自适应的获得音乐的鼓点以及高潮位置。同时提供音乐各章节的横向理解能力,以及区分人声、伴奏、贝斯等的纵向理解能力,可以便捷的在各类场景中使用。



      图片/视频翻译


      图片/视频描述基于时序特征翻译技术,将图片或视频中的视觉信息综合理解,生成对应的文字信息。我们的算法会将单帧的视频图像与视觉空间中的内容上下文进行综合理解;然后将获得的视觉信息转化为文字信息,经过一系列的优化生成贴切的文字描述。相关的能力可以应用在电商等场景中,快速自动化的生成商品介绍。



      落地案例


      目前智能内容生产平台已经服务于全民 K 歌、微视、企鹅号、腾讯视频、腾讯影业等众多产品,每天为海量腾讯 C 端用户提供优质内容。同时协同腾讯云发力 B 端,在传媒、文旅、政务等多个 ToB 行业中得到良好的应用。



      头图:Unsplash

      原文智能内容生产,媒体的智能未来

      来源:腾讯多媒体实验室 - 微信公众号 [ID:TencentAVLab]

      转载:著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

      2020-12-28 23:272631
      用户头像

      发布了 38 篇内容, 共 79636 次阅读, 收获喜欢 31 次。

      关注

      评论 1 条评论

      发布
      用户头像
      pc 浏览器上看到的视频都不能播放,时长显示为 0
      2020-12-29 13:29
      回复
      没有更多了
      发现更多内容

      如何让个性化推荐即刻触达?云原生数据库GaussDB(for Redis)来助力

      华为云开发者联盟

      数据库 云原生 后端

      字节跳动Java研发面试99题(含答案):JVM+Spring+MySQL+线程池+锁

      程序知音

      Java 字节 程序员面试 后端技术 八股文

      兆骑科创海内外引进高层次人才,创新创业项目对接

      兆骑科创凤阁

      施耐德电气、欧莱雅等企业巨头如何开放式创新?DEMO WORLD世界创新峰会揭秘

      创业邦

      GIS数据漫谈(五)— 地理坐标系统

      ThingJS数字孪生引擎

      怎么会不喜欢呢,CI/CD中轻松发送邮件

      Jianmu

      持续集成 低代码 邮件 通知

      2022备战秋招10W字面试小抄pdf版,附操作系统、计算机网络面试题

      程序员啊叶

      Java 编程 程序员 架构 java面试

      收藏!0 基础开源数据可视化平台 FlyFish 大屏开发指南

      云智慧AIOps社区

      大前端 低代码 开源项目 数据可视化工具 开源推荐

      带来高价值用户体验的低代码开发平台

      力软低代码开发平台

      低代码实现探索(四十五)业务参数

      零道云-混合式低代码平台

      2022年金三银四Java面试宝典,横扫春招+社招+秋招

      程序员啊叶

      Java 编程 程序员 架构 java面试

      如何查看蓝牙耳机的蓝牙版本

      贾献华

      7月月更

      美团二面:为什么Redis会有哨兵?

      王小凡

      Java redis 编程 程序员 开发

      【微信小程序】项目实战—抽签应用

      flow

      签约计划第三季

      技术分享| 快对讲综合调度系统

      anyRTC开发者

      音视频 指挥调度 快对讲 语音对讲 视频对讲

      1000个字带你一次性搞懂JavaAgent技术,反正我是彻底服了

      程序员啊叶

      Java 编程 程序员 架构 java面试

      建木持续集成平台v2.5.2发布

      Jianmu

      持续集成 低代码 CI/CD gitops

      搞定RocketMQ这二十三点,大厂面试稳了

      王小凡

      Java 数据库 程序员 面试 大厂面试

      4 轮拿下字节 Offer,面试题复盘

      程序员啊叶

      Java 编程 程序员 架构 java面试

      如何对话CIO/CTO

      凌云Cloud

      销售 企业管理系统 CIO To B业务

      AIRIOT答疑第6期|如何使用二次开发引擎?

      AIRIOT

      二次开发 物联网低代码平台

      浅谈AI深度学习的模型训练和推理

      GVision

      Spring Cloud 架构

      Damon

      7月月更

      Redis网红高频面试题三连:缓存穿透?缓存击穿?缓存雪崩?

      程序员啊叶

      Java 编程 程序员 架构 java面试

      图的遍历的定义以及深度优先搜索和广度优先搜索(二)

      乔乔

      7月月更

      技术实践干货 | 初探大规模 GBDT 训练

      观远数据

      人工智能 机器学习

      深度 | 自动驾驶数据服务进入2.0时代

      澳鹏Appen

      人工智能 自动驾驶 计算机视觉 智能驾驶 激光雷达

      怎样实现文档协同?

      Baklib

      知识管理系统推动企业信息化发展

      Baklib

      从存储角度看自动驾驶必经之路

      焱融科技

      人工智能 自动驾驶 存储 文件存储 分布式文件存储

      一种比读写锁更快的锁,还不赶紧认识一下

      华为云开发者联盟

      高并发 开发 ReadWriteLock StampedLock

      智能内容生产,媒体的智能未来_文化 & 方法_腾讯多媒体实验室_InfoQ精选文章