写点什么

生成式 AI 最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

  • 2024-02-16
    北京
  • 本文字数:918 字

    阅读完需:约 3 分钟

大小:448.50K时长:02:33
生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业

2 月 16 日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。

 

Sora 在日语中意为天空,该技术背后的团队包括 Tim Brooks 和 Bill Peebles,之所以选择这个名字,是希望它能激起无限的创造潜力。


 

OpenAI 给出了不少令人印象深刻的例子:在龙年春节里的舞龙活动,人山人海的场景真假难辨,甚至还有群众拿着手机跟拍的细节;动物世界中,站在树上、戴着王冠的猴子等;在社交媒体上教大家做曲奇的老奶奶;戴着耳机听音乐的两只金毛狗.....




有网友评论说,AI 能根据文字生成图片的时候,他就在想离生成视频的日期不远了,没想到这么快!“又有一波‘固执的’从业者和艺术家们要失业了,从业者门槛进一步拉低!YouTube/TikTok 等一众长视频或短视频网站估计要迎来一波新的流量。”

 

一些 YouTube 网红确实开始担心,MrBeast 发帖半开玩笑地求奥特曼不要让他失业。


 

有投资者则发表评论说,他们早就认为“内容生成干不过大公司,初创公司要做产品和应用……”他们一直认为 Pika 应该转型……

 

而 OpenAI 员工 will depue 则表示,他们过去两个月一直忙于此事,目前 Sora 还处于早期宣传阶段。根据 OpenAI 随后发布的论文来看,这个模型的能力确实已经超出了 OpenAI 最初所宣传的。


 

这篇论文揭示了 Sora 架构的一些关键方面,比如它可以生成任意分辨率和宽高比的视频(最高 1080p)。根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。


将 DALL·E 2 或 DALL·E 3 生成的图片转为视频

 

然而,最令人感兴趣的是 Sora“模拟数字世界”的能力。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频(或交互式 3D 世界,视情况而定)。正如 Nvidia 高级研究员 Jim Fan 所评论的那样,Sora 更像是一个“数据驱动的物理引擎”,而不是一个创意引擎。

 

对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确模拟复杂场景的物理特性方面可能会遇到困难,也可能无法理解具体的因果关系实例。


例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

 

现在,Sora 正面向部分成员开放,以评估关键领域的潜在危害或风险。

2024-02-16 12:4410868

评论 1 条评论

发布
用户头像
666,视频要被AI攻占了
2024-02-19 13:57 · 北京
回复
没有更多了
发现更多内容

JProfiler 14 mac永久稳定版 含jprofiler14激活许可 兼容M1/M2

南屿

Java JProfiler Mac永久激活版 JProfiler 14

软件供应链安全继续强化:SBOM清单基座规范SBOMit启动制订

sender_is_sender

软件开发生命周期 软件供应链安全 软件物料清单(SBOM) in-toto

resolume arena破解版 附安装教程 Mac电脑VJ调试软件 兼容M1

南屿

Mac软件 苹果电脑 Resolume Arena 7破解版 VJ调试 Resolume Arena 安装教程

Red Giant Universe 2024破解版 AE红巨星特效插件包for mac 兼容M1/M2

南屿

红巨人特效插件 视频特效插件 Red Giant2024

EMQ 发布MQTT over QUIC 白皮书:下一代车联网消息传输标准协议

新消费日报

幻兽帕鲁来啦!京东云召唤你一键开服,快来私服联机

京东科技开发者

《Kafka权威指南》PDF

程序员李木子

车内语音识别技术:重塑智能驾驶的未来

数据堂

8个可替代Visio的绘图软件推荐!每一款都堪称神器。

彭宏豪95

效率工具 流程图 在线白板 绘图软件 Visio

轻量级UML建模工具 Astah Professional mac注册激活版 附详细安装教程

南屿

UML建模 Astah Professional破解版 astah professional怎么用

Cheetah3D 8:对 Apple Silicon 的原生支持 Metal API 的本机支持

南屿

动画 渲染 3d建模 Cheetah3D注册机 Cheetah3D 8新功能

C# 面向对象编程进阶:构造函数详解与访问修饰符应用

小万哥

C# 程序人生 编程语言 软件工程 后端开发

OpenAI又放大招!大幅暴降,修复GPT-4变懒!

鹤涵

好用的截图工具Snagit功能介绍及Snagit中文下载安装

Rose

截图 Snagit下载 Snagit 2023 Snagit截图软件

微信Mac版怎么下载安装?含Mac版微信防撤回、多开助手

南屿

微信助手 微信分身

eudic欧路词典下载 mac翻译软件 v4.5.9 增强激活版 支持m1 m2

南屿

Mac 翻译软件 欧路词典 Eudic Eudic欧路词典破解版 英汉翻译

premiere pro 2023的字幕功能使用教程 含PR2023中文下载安装包

南屿

PR adobe PR2023中文版 Premiere Pro字幕

专业的iOS解锁工具AnyMP4 iPhone Unlocker mac直装免激活版

南屿

Mac软件 iPhone解锁器 iOS解锁 AnyMP4 iPhone

作者推荐 | 【深入浅出MySQL】「底层原理」探秘缓冲池的核心奥秘,揭示终极洞察

码界西柚

MySQL 底层原理 缓冲池 Buffer Pool 2024年第二十三篇文章

车内语音识别技术:智能驾驶的革新之源

数据堂

《深入理解Kafka:核心设计与实践原理》PDF

程序员李木子

Turbo Boost Switcher Pro永久激活版 cpu温度检测调节工具 mac软件下载

Rose

苹果电脑 CPU性能 Turbo Boost Switcher Pro cpu频率调节

解决 Parallels Desktop 虚拟机不能连网的问题 含Parallels19一键激活版安装包

Rose

虚拟机 Parallels Desktop

直播预告|原生 vs 跨端,聊聊鸿蒙应用开发的真实感受

小红书技术REDtech

鸿蒙 前端 开发 跨端开发 小红书

Bartender 4 下载 Mac菜单栏管理 v4.2.25 支持m1 m2

南屿

Bartender 4 Bartender5 Bartender破解版 Mac软件下载站

左耳听风 - 管理方式「读书打卡 day 18」

Java 工程师蔡姬

读书笔记 程序员 个人成长 职业发展 管理方式

车内语音识别技术:智能驾驶的核心要素

数据堂

生成式AI最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业_生成式 AI_Tina_InfoQ精选文章