QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

生成式 AI 最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

  • 2024-02-16
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:448.50K时长:02:33
生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

2 月 16 日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。

 

Sora 在日语中意为天空,该技术背后的团队包括 Tim Brooks 和 Bill Peebles,之所以选择这个名字,是希望它能激起无限的创造潜力。


 

OpenAI 给出了不少令人印象深刻的例子:在龙年春节里的舞龙活动,人山人海的场景真假难辨,甚至还有群众拿着手机跟拍的细节;动物世界中,站在树上、戴着王冠的猴子等;在社交媒体上教大家做曲奇的老奶奶;戴着耳机听音乐的两只金毛狗.....




有网友评论说,AI 能根据文字生成图片的时候,他就在想离生成视频的日期不远了,没想到这么快!“又有一波‘固执的’从业者和艺术家们要失业了,从业者门槛进一步拉低!YouTube/TikTok 等一众长视频或短视频网站估计要迎来一波新的流量。”

 

一些 YouTube 网红确实开始担心,MrBeast 发帖半开玩笑地求奥特曼不要让他失业。


 

有投资者则发表评论说,他们早就认为“内容生成干不过大公司,初创公司要做产品和应用……”他们一直认为 Pika 应该转型……

 

而 OpenAI 员工 will depue 则表示,他们过去两个月一直忙于此事,目前 Sora 还处于早期宣传阶段。根据 OpenAI 随后发布的论文来看,这个模型的能力确实已经超出了 OpenAI 最初所宣传的。


 

这篇论文揭示了 Sora 架构的一些关键方面,比如它可以生成任意分辨率和宽高比的视频(最高 1080p)。根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。


将 DALL·E 2 或 DALL·E 3 生成的图片转为视频

 

然而,最令人感兴趣的是 Sora“模拟数字世界”的能力。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频(或交互式 3D 世界,视情况而定)。正如 Nvidia 高级研究员 Jim Fan 所评论的那样,Sora 更像是一个“数据驱动的物理引擎”,而不是一个创意引擎。

 

对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。


例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

 

现在,Sora 正面向部分成员开放,以评估关键领域的潜在危害或风险。

2024-02-16 12:4410790

评论 1 条评论

发布
用户头像
666,视频要被AI攻占了
2024-02-19 13:57 · 北京
回复
没有更多了
发现更多内容

Linux命令之find的高级用法

小毛驴的烂笔头

Linux find

编程技术为王的天下终究要散了吗| 社区征文

卢卡多多

三周年征文

跨平台应用开发进阶(四十九)由环境切换引发的页面通讯机制思考

No Silver Bullet

跨平台应用开发 三周年连更 页面通讯机制

Paimon 专题上线|从 0 到 1 入门新一代流式数据湖存储

Apache Flink

大数据 flink 实时计算

为什么说Flutter无法成为移动应用开发的“顶流明星”?

FinFish

flutter 前端框架 跨端框架

《致“抄我”的朋友:你已经被我列入白名单!》

程序员晚枫

开源

一文读懂线程池的实现原理

老周聊架构

三周年连更

全栈开发实战|SSM框架整合开发

TiAmo

ssm mybits 全栈开发 三周年连更

STM32F103RCT6驱动SG90舵机-完成正反转角度控制

DS小龙哥

三周年连更

超级App与新零售:零售品牌如何利用小程序技术掌握未来商业机会?

FinFish

新零售 超级app 小程序技术 小程序容器技术

美光遭遇审查,存储市场成了“香饽饽”?

脑极体

美光

OpenHarmony/HarmonyOS应用上下文Context

坚果

OpenHarmony OpenHarmony3.2 三周年连更

AI日课@20230417:AI之于教育;ChatGPT Sidebar:一个浏览网页时的强力AI助手

无人之路

人工智能 ChatGPT

Vue3 如何编写一个插件

程序员海军

Vue3 三周年连更

Go语言并发编程的核心 —— GMP调度模型

Jack

Unity 报错之 接入YomboTGSDK后打包报错:mainTemplate.gradle needs to be updated(property ‘unityStreamingAssets‘)

陈言必行

Unity 三周年连更

Spider实战系列-一次真实接单经历让我抓取了某东的数据

浅辄

爬虫 三周年连更

打包python程序 | python小知识

AIWeker

Python python小知识 三周年连更

挑战 30 天学完 Python:Day8 数据类型 - 字典 dict

MegaQi

Python 挑战30天学完Python 三周年连更

Socket学习网络基础

芯动大师

android TCP通信 三周年连更

简单高效的Shell数组操作技巧与技术

小毛驴的烂笔头

linux命令 linux数组

NDP常用报文格式

穿过生命散发芬芳

NDP 三周年连更

去年我是怎么解决团队问题的

光毅

团队管理 领导力

前端三板斧头 --- 编程范式

知心宝贝

JavaScript 学习 编程 前端 三周年连更

华为云等保解决方案为您提供最专业的团队,助您轻松过等保

IT科技苏辞

一文掌握使用 Go 标准库 sort 对切片进行排序

陈明勇

Go golang 排序 三周年连更 sort

使用 Amazon Step Functions 和 Amazon Athena 实现简易大数据编排

亚马逊云科技 (Amazon Web Services)

华为云等保合规方案,守护企业网络安全线

IT科技苏辞

uniapp自定义富文本编辑器

格斗家不爱在外太空沉思

uni-app 三周年连更

HTTP方法大全

阿泽🧸

HTTP 三周年连更

《设计模式之禅》Strategy_Pattern--策略模式

浅辄

设计模式 Java、 三周年连更

生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业_生成式 AI_Tina_InfoQ精选文章