QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

生成式 AI 最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

  • 2024-02-16
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:448.50K时长:02:33
生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

2 月 16 日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。

 

Sora 在日语中意为天空,该技术背后的团队包括 Tim Brooks 和 Bill Peebles,之所以选择这个名字,是希望它能激起无限的创造潜力。


 

OpenAI 给出了不少令人印象深刻的例子:在龙年春节里的舞龙活动,人山人海的场景真假难辨,甚至还有群众拿着手机跟拍的细节;动物世界中,站在树上、戴着王冠的猴子等;在社交媒体上教大家做曲奇的老奶奶;戴着耳机听音乐的两只金毛狗.....




有网友评论说,AI 能根据文字生成图片的时候,他就在想离生成视频的日期不远了,没想到这么快!“又有一波‘固执的’从业者和艺术家们要失业了,从业者门槛进一步拉低!YouTube/TikTok 等一众长视频或短视频网站估计要迎来一波新的流量。”

 

一些 YouTube 网红确实开始担心,MrBeast 发帖半开玩笑地求奥特曼不要让他失业。


 

有投资者则发表评论说,他们早就认为“内容生成干不过大公司,初创公司要做产品和应用……”他们一直认为 Pika 应该转型……

 

而 OpenAI 员工 will depue 则表示,他们过去两个月一直忙于此事,目前 Sora 还处于早期宣传阶段。根据 OpenAI 随后发布的论文来看,这个模型的能力确实已经超出了 OpenAI 最初所宣传的。


 

这篇论文揭示了 Sora 架构的一些关键方面,比如它可以生成任意分辨率和宽高比的视频(最高 1080p)。根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。


将 DALL·E 2 或 DALL·E 3 生成的图片转为视频

 

然而,最令人感兴趣的是 Sora“模拟数字世界”的能力。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频(或交互式 3D 世界,视情况而定)。正如 Nvidia 高级研究员 Jim Fan 所评论的那样,Sora 更像是一个“数据驱动的物理引擎”,而不是一个创意引擎。

 

对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。


例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

 

现在,Sora 正面向部分成员开放,以评估关键领域的潜在危害或风险。

2024-02-16 12:4410842

评论 1 条评论

发布
用户头像
666,视频要被AI攻占了
2024-02-19 13:57 · 北京
回复
没有更多了
发现更多内容

人工智能1秒检测一辆车,TA助力广本新车质量排名第一

百度大脑

Top Trending Libraries of 2021,PaddleOCR再开源8大前沿顶会论文模型!

百度大脑

又一重量级国赛来啦,保研可加分 | 中国软件杯飞桨遥感赛道正式启动

百度大脑

2022美赛单变量深度学习LSTM 时间序列分析预测,作为Python开发者

程序媛可鸥

Python 程序员 面试

一个配件、一块面料,制造企业流水线因为AI变了新模样

百度大脑

CorelDRAW2022下载及新增功能讲解

茶色酒

cdr2022

开学季 | 飞桨AI Studio课程学习,小白也可以成为一名优秀的算法工程师

百度大脑

28,2021最新Python面试笔试题目分享

程序媛可鸥

Python 程序员 面试

k8s组件的梳理(1),Python篇

程序媛可鸥

Python 程序员 面试

Python GUI编程:关于 tkinter 怎么才能写出更好看的界面

程序媛可鸥

Python 程序员 面试

#yyds内容盘点# 一文带你搞懂Python中变量与常量,Python开发框架

程序媛可鸥

Python 程序员 面试

06 - vulhub - Apache HTTPD 多后缀解析漏洞,2021年Python大厂面试分享

程序媛可鸥

Python 程序员 面试

36,Python基础开发与实践

程序媛可鸥

Python 程序员 面试

CSDN终于破2万粉了,几百块钱的课程可白嫖,就是宠粉,Python笔试面试题

程序媛可鸥

Python 程序员 面试

k8s组件的梳理,Glide的缓存机制

程序媛可鸥

Python 程序员 面试

Kafka 常用命令总结,给Python程序员的一些面试建议

程序媛可鸥

Python 程序员 面试

kudu参数优化设置,让集群飞起来~,2021年Python开发陷入饱和

程序媛可鸥

Python 程序员 面试

10个Python set 常用操作函数!,oppoPython面试题

程序媛可鸥

Python 程序员 面试

90后,要有多少存款才正常?答案太扎心了,阿里P8大佬整理

程序媛可鸥

Python 程序员 面试

实用机器学习笔记二十九:NLP 中的微调

打工人!

机器学习 学习笔记 nlp 机器学习算法 3月月更

30余种加密编码类型的密文特征分析,差点挂在第四面

程序媛可鸥

Python 程序员 面试

Apple任意代码执行漏洞,为了跳槽强刷1000道Python真题

程序媛可鸥

Python 程序员 面试

Kafka server,Python面试

程序媛可鸥

Python 程序员 面试

python pandas库统计分析基础必备知识汇总,2021Python网络编程总结篇

程序媛可鸥

Python 程序员 面试

重新开始学习测试驱动开发

escray

学习笔记 测试驱动开发

4万字【Python高级编程】保姆式教学,330页PDF10万字的知识点总结

程序媛可鸥

Python 程序员 面试

python DataFrame数据格式化(设置小数位数,百分比,Python常用面试题

程序媛可鸥

Python 程序员 面试

17个新手常见错误,送给初学Python的你!,憋个大招

程序媛可鸥

Python 程序员 面试

架构实战营 毕业设计项目

樰巳-堕~Horry

架构实战营 「架构实战营」

Girlfriend含苞待笑——一次性处理上百份文档,Python开发实战讲解

程序媛可鸥

Python 程序员 面试

百度希壤元宇宙平台上线首个汽车数字展厅,领克探索汽车营销新方式

百度大脑

生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业_生成式 AI_Tina_InfoQ精选文章