写点什么

生成式 AI 最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

  • 2024-02-16
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:448.50K时长:02:33
生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

2 月 16 日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。

 

Sora 在日语中意为天空,该技术背后的团队包括 Tim Brooks 和 Bill Peebles,之所以选择这个名字,是希望它能激起无限的创造潜力。


 

OpenAI 给出了不少令人印象深刻的例子:在龙年春节里的舞龙活动,人山人海的场景真假难辨,甚至还有群众拿着手机跟拍的细节;动物世界中,站在树上、戴着王冠的猴子等;在社交媒体上教大家做曲奇的老奶奶;戴着耳机听音乐的两只金毛狗.....




有网友评论说,AI 能根据文字生成图片的时候,他就在想离生成视频的日期不远了,没想到这么快!“又有一波‘固执的’从业者和艺术家们要失业了,从业者门槛进一步拉低!YouTube/TikTok 等一众长视频或短视频网站估计要迎来一波新的流量。”

 

一些 YouTube 网红确实开始担心,MrBeast 发帖半开玩笑地求奥特曼不要让他失业。


 

有投资者则发表评论说,他们早就认为“内容生成干不过大公司,初创公司要做产品和应用……”他们一直认为 Pika 应该转型……

 

而 OpenAI 员工 will depue 则表示,他们过去两个月一直忙于此事,目前 Sora 还处于早期宣传阶段。根据 OpenAI 随后发布的论文来看,这个模型的能力确实已经超出了 OpenAI 最初所宣传的。


 

这篇论文揭示了 Sora 架构的一些关键方面,比如它可以生成任意分辨率和宽高比的视频(最高 1080p)。根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。


将 DALL·E 2 或 DALL·E 3 生成的图片转为视频

 

然而,最令人感兴趣的是 Sora“模拟数字世界”的能力。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频(或交互式 3D 世界,视情况而定)。正如 Nvidia 高级研究员 Jim Fan 所评论的那样,Sora 更像是一个“数据驱动的物理引擎”,而不是一个创意引擎。

 

对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。


例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

 

现在,Sora 正面向部分成员开放,以评估关键领域的潜在危害或风险。

2024-02-16 12:4410773

评论 1 条评论

发布
用户头像
666,视频要被AI攻占了
2024-02-19 13:57 · 北京
回复
没有更多了
发现更多内容

敏捷任务拆解、工作量评估和指派

laofo

Scrum 敏捷 敏捷开发 研发效能 持续交付

开源漏洞共享平台及安全奖励计划正式发布

开放原子开源基金会

Java 开源 程序员 开发者 算法

为开发者服务,让梦想成为可能|孙文龙理事长发表专题演讲

开放原子开源基金会

Java 开源 程序员 开发者 算法

数据库:mysqldump用法详解

百度搜索:蓝易云

MySQL Linux 运维 mysqldump 云服务器

MacCleaner 3 Pro中文激活:Mac电脑强大的清理优化软件

胖墩儿不胖y

优化软件 Mac软件推荐 系统优化工具

一文详解 BRC20 衍生品协议 Bitcat,铭文市场长期发展的助推器

鳄鱼视界

Cilium CNI深度指南

俞凡

Kubernetes 云原生 网络 通信

C 语言教程:数据类型和格式说明符

小万哥

c 程序员 软件 后端 开发

单口千兆以太网物理层芯片

芯动大师

软件开发

Geek_8da502

Vue 2 即将停止更新

南城FE

JavaScript Vue 前端开发

图像处理AI软件推荐:Topaz Photo AI 激活直装版

胖墩儿不胖y

Mac软件 图像处理工具

拼多多ID取商品详情API:电商行业的秘密武器与实时数据获取的智慧之路

Noah

小红书商品详情API:电商助力

Noah

APIitem_get:你的淘宝商品详情搜索神器

技术冰糖葫芦

API 接口

图说技术:我的技术文章配图实践经验

Java 工程师蔡姬

技术人 21 天技术人写作行动营

【PHP】thinkPHP6中的MVC思想的小案例

Geek_Angel

php mvc thinkphp6

一文详解 BRC20 衍生品协议 Bitcat,铭文市场长期发展的助推

威廉META

生成式AI给我们带来的影响

月下独酌

大模型

开放原子开源基金会与9个开源项目举行捐赠签约仪式

开放原子开源基金会

Java 开源 程序员 开发者 算法

系统综合清理优化推荐 MacCleaner 3 Pro 激活中文版

mac大玩家j

系统优化 Mac软件 系统优化工具

GaussDB整体性能慢分析教程。

百度搜索:蓝易云

云计算 Linux 运维 GaussDB 云服务器

有OpenHarmony技术问题,上Laval社区

Geek_2d6073

OpenHarmony创新赛圆满收官:引领开源趋势,开启创新技术新纪元

新消费日报

INFINI Labs 产品更新 | Easysearch 新增快照搜索功能,Console 支持 OpenSearch 存储

极限实验室

console easysearch

体育直播程序源代码降低搭建门槛,低成本建体育赛事平台成为行业常态

软件开发-梦幻运营部

开放原子云社区正式成立

开放原子开源基金会

Java 开源 程序员 开发者 算法

如何使用 NFTScan NFT API 在 Viction 网络上开发 Web3 应用

NFT Research

NFT NFT\ NFTScan

生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业_生成式 AI_Tina_InfoQ精选文章