写点什么

阿里云开源视频生成大模型 I2VGen-XL,2 分钟生成高清电影级效果视频

  • 2023-09-06
    北京
  • 本文字数:749 字

    阅读完需:约 2 分钟

大小:434.29K时长:02:28
阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频

近日,阿里云推出全新视频生成大模型 I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后 2 分钟左右即可生成一段 1280*720 的高分辨率视频。据介绍,该模型的训练还使用了多种风格的视频数据,可生成科技感、电影色、卡通风格和素描等类型丰富的视频。目前,I2VGen-XL 的模型和代码均已开源。

 

在此之前,阿里云曾推出 AI 绘画创作大模型通义万相(基座模型 Composer)和可控视频生成模型 VideoComposer,团队在该领域发表 60 多篇 CCF-A 类论文,并在国际顶级视觉竞赛中获得 10 余项冠军。

 

和 AI 绘画创作大模型相比,视频生成大模型的技术门槛更高,其需要克服文本和视频内容匹配度、视频画面质量、画面连续性等诸多技术挑战。在此之前,阿里云和微软等科技公司相继推出一系列可控视频生成研究成果,例如用户可通过定义空间布局、运动模式等条件来生成视频,但其画面清晰度难以满足真实场景应用的需求。

 

针对该问题,阿里云进一步提出创新思路,I2VGen-XL 模型设计了两个阶段:首先在低分辨率条件下保证生成结果和给定图像语义的匹配度,随后通过视频扩散模型(VLDM)来提高视频分辨率,并同时提升时间和空间上的一致性,保证最终视频内容的清晰度和连贯性,最终实现 1280*720 高分辨率的突破,并且在画面细节的展现上大幅领先现有模型。

 

I2VGen-XL 模型研发负责人表示,未来将进一步实现 2K 超清效果,可应用于短视频内容生产、电影制作等场景。


I2VGen-XL流程图

 

目前,I2VGen-XL 模型已吸引国内外用户和开发者的广泛体验和二次开发,涌现了大量创意 AI 视频生成内容,例如在城堡上展翅的恐龙、宇航员在飞船中行走的科幻电影画面等等……知名 AI 社交媒体分析师 Ahsen Khaliq 在推特发布多条由该模型生成的视频效果,并表示模型在清晰度、纹理、语义和时间连续性方面有优势。



模型体验地址:

https://modelscope.cn/studios/damo/I2VGen-XL-Demo/summary

2023-09-06 11:278576

评论

发布
暂无评论
发现更多内容

企业用户需要什么样的私有云

青椒云云电脑

云桌面

WorkPlus打造企业移动门户,实现高效协作与便捷访问

BeeWorks

深势科技基于 Serverless 容器为科研人员打造高效的开发平台

阿里巴巴云原生

阿里云 Serverless Kubernetes 容器 云原生

语音识别技术:原理、应用与未来

数据堂

私有云的优缺点是什么?与公有云的区别

青椒云云电脑

云桌面

科技快讯丨浪潮海岳PaaS平台重磅升级,筑牢企业数字化创新底座

inBuilder低代码平台

Last Week in Milvus

Zilliz

非结构化数据 Milvus Zilliz 向量数据库

语音识别技术:未来人机交互的重要接口

数据堂

WorkPlus局域网聊天软件,打造高效沟通与协作的完美选择

BeeWorks

英特尔FPGA系列再扩容,打造完美产品矩阵

E科讯

【活动回顾】Rust:构建新时代基础设施的首选语言 @Qcon

Databend

哪些类型的企业应该选择混合云

青椒云云电脑

云桌面 私有云云桌面 公有云云桌面

云桌面如何助力校园云办公 老师这么说

青椒云云电脑

云桌面

便捷、高并发、高可用 揭秘搭建校园云平台的理由

青椒云云电脑

云平台

低代码开发平台的优点和缺点

互联网工科生

低代码 可视化开发 JNPF

语音识别技术的挑战与机遇

数据堂

私有云公有云二选一?混合云了解一下

青椒云云电脑

公有云 私有云 云桌面

几分钟搞定Java程序CPU飙升场景

HelloGeek

Java Docker 容器 解决方案

低代码平台:解决开发中的重复“造轮子”

树上有只程序猿

低代码 造轮子

征服数据宇宙,新华三存储护卫队早有准备?

脑极体

存储

数字矿山:智慧煤矿可视化2D组态系统

2D3D前端可视化开发

组态软件 智慧矿山 2D组态 智慧煤矿 智慧矿井

加入华为云AIGC实战营,一起探索AI前沿技术!

科技热闻

Text2Cypher:大语言模型驱动的图查询生成

NebulaGraph

LLM

新老用户看过来~最实用的 Milvus 迁移手册来啦!

Zilliz

数据迁移 Milvus Zilliz 向量数据库

Apache IoTDB v1.2.0/v1.2.1 发布|增加流处理框架、动态模板等新功能

Apache IoTDB

Arrays.asList():使用指南

越长大越悲伤

Java

ByConity 0.2.0 版本发布

字节跳动开源

数据库 大数据 开源 开源社区 数仓

阿里云开源视频生成大模型I2VGen-XL,2分钟生成高清电影级效果视频_阿里巴巴_凌敏_InfoQ精选文章