开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

豆包视频生成大模型正式发布,首次突破多主体互动难关

  • 2024-09-24
    北京
  • 本文字数:1081 字

    阅读完需:约 4 分钟

大小:581.81K时长:03:18
豆包视频生成大模型正式发布,首次突破多主体互动难关

字节跳动正式宣告进军 AI 视频生成。9 月 24 日,字节跳动旗下火山引擎在深圳举办 AI 创新巡展,一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed 两款大模型,面向企业市场开启邀测。

 

  • 多动作多主体交互能力示例:

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    • 一致性切镜能力示例:

    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      “视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展 AI 视频的创作空间和应用落地。”火山引擎总裁谭待表示。

       

      据火山引擎介绍,豆包视频生成模型基于 DiT 架构,通过高效的 DiT 融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性。

       

      据悉,豆包视频生成模型经过剪映、即梦 AI 等业务场景打磨和持续迭代,来达到具备专业级光影布局和色彩调和、画面视觉极具美感和真实感的目的。深度优化的 Transformer 结构则大幅提升豆包视频生成的泛化能力,支持 3D 动画、2D 动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。


      目前,新款豆包视频生成模型正在即梦 AI 内测版小范围测试,未来将逐步开放给所有用户。剪映和即梦 AI 市场负责人陈欣然认为,AI 能够和创作者深度互动,共同创作,带来很多惊喜和启发,即梦 AI 希望成为用户最亲密和有智慧的创作伙伴。

       

      此外,豆包大模型不仅新增视频生成模型,还发布了豆包音乐模型和同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。

       

      火山引擎在这次发布会上还披露了豆包大模型的使用量。据悉,截至 9 月,豆包语言模型的日均 tokens 使用量超过 1.3 万亿,相比 5 月首次发布时增加十倍,多模态数据处理量也分别达到每天 5000 万张图片和 85 万小时语音。

       

      此前,豆包大模型公布低于行业 99%的定价,引领国内大模型开启降价潮。谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大规模应用,大模型支持更大的并发流量正在成为行业发展的关键因素。

       

      谭待介绍,业内多家大模型目前最高仅支持 300K 甚至 100K 的 TPM(每分钟 token 数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM 峰值为 360K,某汽车智能座舱的 TPM 峰值为 420K,某 AI 教育公司的 TPM 峰值更是达到 630K。为此,豆包大模型默认支持 800K 的初始 TPM,客户还可根据需求灵活扩容。

       

      “在我们努力下,大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能,卷更好的模型能力和服务。”谭待说道。

      2024-09-24 16:397700

      评论 1 条评论

      发布
      用户头像
      生成的都是欧美人?
      2024-09-30 11:00 · 北京
      回复
      没有更多了
      发现更多内容

      sharding-jdbc 分库分表的 4种分片策略,还蛮简单的

      程序员小富

      Java 分库分表

      WebSocket连接错误Error during WebSocket handshake Unexpected response code 404

      洛神灬殇

      【原创】SpringBoot 这几种配置文件方式,你都用过吗?

      田维常

      spring Boot Starter

      浅析一个较完整的SpringBoot项目

      田维常

      spring Boot Starter

      【原创】Spring Boot 集成Spring Data JPA的玩法

      田维常

      spring Boot Starter

      【原创】Spring Boot集成Mybatis的玩法

      田维常

      spring Boot Starter

      详解软件行业低代码开发平台以及敏捷开发方案

      Marilyn

      敏捷开发

      国家超算深圳中心计划2年内提升计算能力至少1000倍;图神经网络的生成式预训练论文解读

      京东科技开发者

      云计算

      区块链数字货币商城系统开发技术

      薇電13242772558

      区块链 数字货币

      如何快速构建Spring Boot基础项目?

      田维常

      spring Boot Starter

      物联网时代存储告急 边缘存储如何缓解存储压力?

      京东科技开发者

      云计算 云服务 云存储

      华为20级工程师吐血整理出600页Spring微服务架构设计,绝了!

      996小迁

      Java spring 编程 架构 微服务

      阿里P8架构师呕心沥血整理的【Docker实战】文档带你玩转Docker。

      Java架构之路

      Java 程序员 架构 面试 编程语言

      【原创】Spring Boot 过滤器、监听器、拦截器的使用

      田维常

      spring Boot Starter

      只需三步,带你从0到1玩转React,附源码我一定给你讲明白

      小Q

      Java 学习 编程 架构 面试

      华为云FusionInsight湖仓一体解决方案的前世今生

      华为云开发者联盟

      数据库 华为 仓库

      MySQL-技术专题-STRAIGHT_JOIN

      洛神灬殇

      华为云“创原会”:40+技术精英论道云原生2.0

      华为云开发者联盟

      k8s 华为云

      架构师训练营第 1 期第 7 周作业

      业哥

      为什么11·11物流一年比一年快?奥秘就在这里!

      华为云开发者联盟

      物联网 物流 仓储

      MySQL-技术专题-创建临时表

      洛神灬殇

      【原创】Spring Boot集成Redis的玩法

      田维常

      spring Boot Starter

      Spring Boot 集成 Druid 监控数据源

      田维常

      spring Boot Starter

      【原创】Spring Boot一口气说自动装配与案例

      田维常

      spring Boot Starter

      【原创】Spring Boot 如何手写stater

      田维常

      spring Boot Starter

      2020双十一终极清单!阿里云CDN&视频云最全优惠攻略

      阿里云Edge Plus

      CDN

      产品经理团队的管理秘法

      马踏飞机747

      管理 产品经理 团队

      用时半个月,终于把2020年各大公司的Java面试题精选整理成文档了

      Java架构之路

      Java 架构 面试 编程语言

      阿里P8Java大神给迷茫的程序员一些中肯建议:“请不要再虚度光阴了!”

      Java架构之路

      Java 阿里巴巴 程序员 架构 编程语言

      【原创】SpringBoot快速整合Thymeleaf模板引擎

      田维常

      spring Boot Starter

      Spring Boot 如何快速实现定时任务

      田维常

      spring Boot Starter

      豆包视频生成大模型正式发布,首次突破多主体互动难关_AI&大模型_褚杏娟_InfoQ精选文章