写点什么

智谱上线视频生成模型:30 秒生成 6 秒时长,免费不限次!B 站也有研发功劳?

  • 2024-07-27
    北京
  • 本文字数:1300 字

    阅读完需:约 4 分钟

大小:655.85K时长:03:43
智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?

整理 | 华卫

 

Sora 毫无疑问带来 AI 大模型的全新玩法,大模型可基于任意文字生成视频,包括 Runway 的 Gen 系列、微软的 Nuwa、Meta 的 Emu、谷歌的 Phenaki/VideoPoet、智谱 CogVideo 等。

 

7 月 26 日,智谱 AI CEO 张鹏在智谱 Open Day 上宣布,AI 生成视频模型清影(Ying)正式上线智谱清言,只需要 30 秒时间就能生成 6 秒时长、1440x960 清晰度的 3:2 比例视频。当日起,所有 C 端用户都能通过清影(Ying)体验到 AI 文生视频、图生视频能力。

 


PC 端链接:https://chatglm.cn/video

移动端链接:https://chatglm.cn/download?fr=web_home

 

输入一段文字后(俗称 Prompt),用户可以选择自己想要生成的风格,包括卡通 3D、黑白、油画、电影感等,配上清影自带的音乐,就能够生成充满 AI 想象力的视频片段。

 

除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,就能让凝练在旧时光中的照片灵动起来。

 

现在,清影(Ying)API 已同步上线大模型开放平台 bigmodel.cn,企业和开发者通过调用 API 的方式,体验和使用文生视频以及图生视频的模型能力。

 

据了解,清影(Ying)的付费方案是:在首发测试期间,所有用户均可免费使用,不限次数。此后,付费 5 元可解锁一天(24 小时)的高速通道权益,付费 199 元可解锁一年的付费高速通道权益。 

 

清影上线后,我们也第一时间测试了它的实际效果。

 

文生视频

 

先来看看对于可爱动物的视频生成效果。我们输入了以下两个提示词:

 

prompt1:两只小浣熊打架抢苹果

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    prompt2:一只奶牛猫在看猫和老鼠的动画片

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      图生视频

      再来看看对于人类的视频生成效果,我们输入了一张“仕女拉小提琴”的图片:

       


      得到的视频如下:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        背后自研技术,推理速度比前代提升 6 倍

        据介绍,清影(Ying)底座的视频生成模型是 CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了 Sora 的算法设计;它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。

         

        并且,智谱自研了一个端到端视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型的文本理解和指令遵循能力,使得生成的视频更符合用户的输入,能够理解超长复杂 prompt 指令。

         

        在内容连贯性上,智谱 AI 自研高效三维变分自编码器结构(3D VAE),将原视频空间压缩至 2%大小,配合 3D RoPE 位置编码模块,更有利于在时间维度上捕捉帧间关系,建立起视频中的长程依赖。

         

        该生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的 scaling 方式。”张鹏表示:“随着算法、数据不断迭代,相信 Scaling Law 将继续发挥强大威力。”

         

        bilibili 作为合作伙伴也参与并支持清影的研发过程。同时,合作伙伴华策影视也参与了模型共建。

         

        此外,智谱 AI 生成式视频研发得到北京市的大力支持,海淀区是智谱 AI 总部所在地,为智谱 AI 开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。智谱 AI 生成式视频研发算力支持则来自于亦庄集群,目前北京亦庄人工智能公共算力平台已建成。

        2024-07-27 16:006809

        评论

        发布
        暂无评论

        假如问:你是怎样优化Vue项目的,该怎么回答

        bb_xiaxia1998

        Vue

        京东云开发者|mysql基于binlake同步ES积压解决方案

        京东科技开发者

        MySQL ES 数据同步 MySQL 数据库

        Centos7下Docker的安装

        我是一个茶壶

        容器 ,docker 11月月更

        澜舟科技AIGC再进一步,推出澜舟论文助写 LPA,用 AI 帮助写好英文论文

        澜舟孟子开源社区

        人工智能 nlp 文本生成

        react源码中的hooks

        flyzz177

        React

        假如面试官要你手写一个promise

        helloworld1024fd

        JavaScript

        美团前端常考手写面试题(边面边更)

        helloworld1024fd

        JavaScript

        走进 Orca 架构及技术世界

        KaiwuDB

        数据库·

        从华泰证券年报看数字化转型的平台化趋势

        三少爷的见

        数字化转型 数字化 华泰证券 平台化

        最近面试经常被问到的js手写题

        helloworld1024fd

        JavaScript

        重磅!涛思数据发布TDengine PI连接器

        TDengine

        数据库 tdengine 时序数据库

        MASA MAUI Plugin (五)Android 指纹识别

        MASA技术团队

        blazor MASA MAUI Xamarin MASA Blazor

        Baklib|如何才能做好企业内部知识管理?

        Baklib

        知识管理

        OpenHarmony移植案例: build lite源码分析之hb命令__entry__.py

        华为云开发者联盟

        鸿蒙 芯片 华为云 源代码 企业号十月 PK 榜

        想会用synchronized锁,先掌握底层核心原理

        华为云开发者联盟

        开发 华为云 企业号十月 PK 榜

        京东云开发者|代码评审的价值和规范

        京东科技开发者

        单元测试 代码设计 代码评审 `后端

        阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率

        阿里云弹性计算

        HPC

        vue面试经常会问的那些题

        bb_xiaxia1998

        Vue

        CTO:我叫你画个技术图给我看看,咋就这么费劲呢?

        程序员小毕

        程序员 程序人生 CTO 画图软件 架构图

        聊聊前端开发中的 Ghost Design 设计思路

        汪子熙

        前端开发 angular web开发 SAP 11月月更

        低码平台标准列表页落地实践,同事直呼好活

        Java全栈架构师

        Java 程序员 程序人生 低代码开发 低代码平台

        AI技术在基于风险测试模式转型中的应用

        百度Geek说

        人工智能 AI技术 企业号十月 PK 榜 智能测试

        react源码中的生命周期和事件系统

        flyzz177

        React

        写个JS深拷贝,面试备用

        helloworld1024fd

        JavaScript

        【电商实战00】用敏捷开发的思想,带你快速上手实战项目

        王中阳Go

        golang 高效工作 学习方法 11月月更 电商实战

        链上互助公排代币模式dapp系统开发合约定制

        开发微hkkf5566

        react源码中的协调与调度

        flyzz177

        React

        共筑使能千行百业的数字底座 | HDC 2022松湖对话顺利召开

        OpenHarmony开发者

        OpenHarmony

        一个合格的vue工程师必会的20道面试题

        bb_xiaxia1998

        Vue

        Baklib|搭建帮助中心,推动SaaS企业发展

        Baklib

        SaaS 帮助中心

        聊聊FinOps

        Jianmu

        智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?_生成式 AI_华卫_InfoQ精选文章