写点什么

智谱上线视频生成模型:30 秒生成 6 秒时长,免费不限次!B 站也有研发功劳?

  • 2024-07-27
    北京
  • 本文字数:1300 字

    阅读完需:约 4 分钟

大小:655.85K时长:03:43
智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?

整理 | 华卫

 

Sora 毫无疑问带来 AI 大模型的全新玩法,大模型可基于任意文字生成视频,包括 Runway 的 Gen 系列、微软的 Nuwa、Meta 的 Emu、谷歌的 Phenaki/VideoPoet、智谱 CogVideo 等。

 

7 月 26 日,智谱 AI CEO 张鹏在智谱 Open Day 上宣布,AI 生成视频模型清影(Ying)正式上线智谱清言,只需要 30 秒时间就能生成 6 秒时长、1440x960 清晰度的 3:2 比例视频。当日起,所有 C 端用户都能通过清影(Ying)体验到 AI 文生视频、图生视频能力。

 


PC 端链接:https://chatglm.cn/video

移动端链接:https://chatglm.cn/download?fr=web_home

 

输入一段文字后(俗称 Prompt),用户可以选择自己想要生成的风格,包括卡通 3D、黑白、油画、电影感等,配上清影自带的音乐,就能够生成充满 AI 想象力的视频片段。

 

除了文本生成视频,也可以到清影上玩图片生成视频。图生视频带来了更多的新玩法,包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的「老照片动起来」小程序也会同步上线,只需一步上传老照片,就能让凝练在旧时光中的照片灵动起来。

 

现在,清影(Ying)API 已同步上线大模型开放平台 bigmodel.cn,企业和开发者通过调用 API 的方式,体验和使用文生视频以及图生视频的模型能力。

 

据了解,清影(Ying)的付费方案是:在首发测试期间,所有用户均可免费使用,不限次数。此后,付费 5 元可解锁一天(24 小时)的高速通道权益,付费 199 元可解锁一年的付费高速通道权益。 

 

清影上线后,我们也第一时间测试了它的实际效果。

 

文生视频

 

先来看看对于可爱动物的视频生成效果。我们输入了以下两个提示词:

 

prompt1:两只小浣熊打架抢苹果

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    prompt2:一只奶牛猫在看猫和老鼠的动画片

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      图生视频

      再来看看对于人类的视频生成效果,我们输入了一张“仕女拉小提琴”的图片:

       


      得到的视频如下:

      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        背后自研技术,推理速度比前代提升 6 倍

        据介绍,清影(Ying)底座的视频生成模型是 CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了 Sora 的算法设计;它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。

         

        并且,智谱自研了一个端到端视频理解模型,用于为海量的视频数据生成详细的、贴合内容的描述,这样可以增强模型的文本理解和指令遵循能力,使得生成的视频更符合用户的输入,能够理解超长复杂 prompt 指令。

         

        在内容连贯性上,智谱 AI 自研高效三维变分自编码器结构(3D VAE),将原视频空间压缩至 2%大小,配合 3D RoPE 位置编码模块,更有利于在时间维度上捕捉帧间关系,建立起视频中的长程依赖。

         

        该生成式视频模型的研发中,Scaling Law 继续在算法和数据两方面发挥作用。“我们积极在模型层面探索更高效的 scaling 方式。”张鹏表示:“随着算法、数据不断迭代,相信 Scaling Law 将继续发挥强大威力。”

         

        bilibili 作为合作伙伴也参与并支持清影的研发过程。同时,合作伙伴华策影视也参与了模型共建。

         

        此外,智谱 AI 生成式视频研发得到北京市的大力支持,海淀区是智谱 AI 总部所在地,为智谱 AI 开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。智谱 AI 生成式视频研发算力支持则来自于亦庄集群,目前北京亦庄人工智能公共算力平台已建成。

        2024-07-27 16:007050

        评论

        发布
        暂无评论
        发现更多内容

        代码随想录训练营 Day09 - 字符串(下)

        jjn0703

        INFINI Labs 产品更新 | Easysearch 新增 kNN 搜索功能、Console 支持 LDAP 认证登录等

        极限实验室

        console Gateway 产品更新 easysearch 极限科技

        Kurator v0.4.0版本更新4大内容,满足多云环境的复杂需求

        华为云开发者联盟

        云原生 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

        3DCAT实时云渲染助力VR虚拟现实迈向成熟

        3DCAT实时渲染

        实时渲染

        区块链生态架构 | 社区征文

        TiAmo

        区块链 Baas 年中技术盘点

        户外led显示屏常见规格有哪些

        Dylan

        广告 屏幕亮度 像素 LED显示屏 户外LED显示屏

        知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等

        汀丶人工智能

        自然语言处理 知识图谱 信息抽取

        王海峰最新发声!

        飞桨PaddlePaddle

        人工智能 百度 paddle 飞桨 百度飞桨

        谈谈我这两年的前端开发经验

        树上有只程序猿

        源码解读之FutureTask如何实现最大等待时间

        EquatorCoco

        源码 前端 前端工具

        5个祖传的Python自动化办公项目,治愈你的抑郁

        程序员晚枫

        Python 微信 自动化 机器人 办公

        手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示

        汀丶人工智能

        人工智能 自然语言处理 nlp 知识图谱

        中国大模型的落地DNA,写在这个双螺旋结构里

        脑极体

        AI

        深入解析Redis的LRU与LFU算法实现

        vivo互联网技术

        redis LRU LFU

        企业内容管理升级 3.0:构建生态协同,助力合规成长

        风来兮

        软件 电子档案 OCR 合规 #人工智能

        Pytorch: 数据读取机制Dataloader与Dataset

        timerring

        人工智能

        PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

        股市老人

        几天不写React,已经看不懂语法了

        伤感汤姆布利柏

        拥抱抑郁,制心一处,一切美好是深度投入的产物

        B Impact

        PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

        西柚子

        如何优化Flutter的性能?

        没有用户名丶

        深度剖析之由浅入深揭秘JavaScript类型转换(最全总结篇)

        Immerse

        JavaScript 类型转换 隐式转换 类型 强制类型转换

        2023-07-06:RabbitMQ中的AMQP是什么?

        福大大架构师每日一题

        Rabbit 福大大架构师每日一题

        PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

        威廉META

        PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

        鳄鱼视界

        Rainbond开源

        EquatorCoco

        开源 rainbond

        智能电视APP鲜时光,如何应用AB测试打造极致的用户观看体验?

        字节跳动数据平台

        万字血书React—走近React

        不在线第一只蜗牛

        React 教程分享

        Git操作不规范,战友提刀来相见!

        树上有只程序猿

        PoseiSwap 更新第二期空投,持有 Zepoch 节点数量将决定空投回报

        BlockChain先知

        智谱上线视频生成模型:30秒生成6秒时长,免费不限次!B 站也有研发功劳?_生成式 AI_华卫_InfoQ精选文章