写点什么

OpenAI Sora 发布时间“定档”,可能允许内容中出现裸体

  • 2024-03-15
    北京
  • 本文字数:2246 字

    阅读完需:约 7 分钟

大小:1016.13K时长:05:46
OpenAI Sora发布时间“定档”,可能允许内容中出现裸体

OpenAI 公司首席技术官 Mira Murati 最近在接受《华尔街日报》采访时,透露 Sora 将于“今年”推出,“可能需要几个月”。

 

Murati 于 2018 年加入 OpenAI,担任应用人工智能与合作关系副总裁。彼时,OpenAI 的研究工作正处于快速发展阶段,巨额开支也逐渐超出其承受能力。2019 年,OpenAI 转型为盈利实体,但设置了盈利上限。

 

Murati 在 OpenAI 晋升迅速,先后担任产品与合作关系高级副总裁,以及首席技术官 (CTO)。 在她担任 CTO 期间,OpenAI 发布了 DALL-E 2 和 ChatGPT 等备受瞩目的 AI 产品,引起了公众的广泛关注。

 

《华尔街日报》的这次采访广泛探讨了相关主题,包括 AI 引擎能够生成哪些内容类型、以及当前正在实施的安全措施。打击错误信息已经成为目前 OpenAI 公司的工作重点。Murati 表示,Sora 将设置多重安全护栏,以确保该项技术不会遭到滥用。她解释称,开发团队不希望发布“可能影响全球选举”的功能。报道指出,Sora 将遵循与 Dall-E 相同的提示词政策,即拒绝生成美国总统等“公众人物形象”。

 

Sora 的正式版本还将为输出添加水印。画面右下角将显示半透明的 OpenAI 标识,表示内容为 AI 生成产物。Murati 补充道,开发团队还考虑将内容来源作为另一项重要指标,即使用元数据来提供关于数字媒体的来源信息。这些努力当然都很好,但恐怕还远远不够。去年,一组研究人员已经成功打破了“现有图像水印保护”机制,其中也包括 OpenAI 的保护方案。希望这次开发团队能想出更加牢不可破的新办法。

 

更多生成功能

 

和传闻中生成视频需要数个小时的说法不同,现场展示 Sora 生成一段 20 秒长、720P 分辨率的视频,只用了几分钟。

 

另外,Sora 的运行成本要比 Dall-E“贵很多”。OpenAI 正在尝试使这个工具在公开发布时的成本与公司的 AI 文本到图片模型 DALL-E“相似”。

 

在聊起 Sora 的未来发展时,Murati 带来了不少有趣的消息。首先,开发团队计划“最终”为视频添加声音,以使其观感更加真实。编辑工具也在筹备当中,希望为在线创作者提供一种修复 AI 错误的良好方法。

 

尽管 Sora 已经相当先进,但它同样会经常犯错。采访中最突出的例子就是一段提示词,其要求引擎生成一段视频,内容是机器人从一名女性手中偷走相机。可结果恰恰相反,片段显示女子身体有一部分变成了机械结构。Murati 承认 Sora 仍有改进的空间,并表示 Sora AI“在连续性方面已经相当出色,但还不够完美”。

 


此外,展示裸体也被提上了议程。Murati 指出,OpenAI 正在与“艺术家们……共同探索”可以展示哪些裸体内容:“就像你可以想象的那样…… 艺术家们可能希望在创作过程中拥有更多的控制权。目前,我们正与来自不同领域的艺术家和创作者合作,共同探索最实用的功能,以及该工具应该提供怎样的灵活性水平。”

 

开发团队发现“艺术性”的裸体和严禁未经同意的 deepfakes 之间似乎并没有不可调和的矛盾。当然,OpenAI 肯定不希望被再次卷入的舆论讨伐的中心,他们的唯一目标是把自家产品打造成拓展创造力的平台。

 

测试仍在持续进行

 

在被问及 Sora 使用的训练数据时,Murati 的态度则有些躲闪。OpenAI 最近面临版权侵权诉讼,指控该 AI 公司在未经许可的情况下抓取内容来训练 ChatGPT。 

 

她先是宣称,据她所知除了“公开可用的数据及许可数据”之外,应该没有使用其他数据来训练 AI。但 Murati 也承认,她并不确定有训练期间有没有使用过来自 YouTube、Facebook 或者 Instagram 的视频素材。而且她后来坦言,确实有使用 Shutterstock 的媒体内容进行训练。这里给大家提个醒,Shutterstock 与 OpenAI 之间属于合作伙伴关系,也许这就是 Murati 愿意确认这一素材来源的理由。

 


有网友评论说:“耐人寻味的是,当被问及他们训练数据来源时,Murati 的回答非常谨慎。她的肢体语言透露了很多信息,很明显他们使用了来自受版权保护来源的训练数据。多少有点「事后求原谅,而非事先请求许可」的意思。”

 


Sora 项目人员 Tim Brooks 在接受其他媒体采访时,也对“使用什么训练数据的问题”的问题避而不答:“这个不方便说太细,但大体上,包括公开数据及 OpenAI 的被授权数据。”

 

不过 Tim Brooks 在回答这个问题中,也额外分享了他们的通过海量视频数据进行训练的一个细节:“以前,不论图像还是视频模型,大家通常只在一个固定尺寸上进行训练。而我们使用了不同时长、比例和清晰度的视频,来训练 Sora。至于做法,我们把各种各样的图片和视频,不管是宽屏的、长条的、小片的、高清的还是低清的,我们都把它们分割成了一小块一小块的。接着,我们可以根据输入视频的大小,训练模型认识不同数量的小块。通过这种方式,我们的模型就能够更加灵活地学习各种数据,同时也能生成不同分辨率和尺寸的内容。”

 

Murati 承诺 Sora“肯定”会在今年年底前推出,但并没有给出确切日期,只表示应该会在未来几个月内发布。目前,开发团队仍在对引擎进行安全测试,希望找到任何“漏洞、偏见以及其他有害结果”。

 

如果大家想要第一时间体验 Sora,我们建议您首先学会使用编辑软件。毕竟需要牢记一点,Sora 会犯很多错误,哪怕在正式版发布后也不可能彻底避免。总之,让我们共同期待这位新秀的亮相演出!

 

参考链接:

https://www.wsj.com/tech/personal-tech/openai-cto-sora-generative-video-interview-b66320bb

https://archive.ph/D1pdw#selection-4625.38-4625.44

https://www.techradar.com/computing/artificial-intelligence/openais-sora-will-one-day-add-audio-editing-and-may-allow-nudity-in-content

https://www.reddit.com/r/OpenAI/comments/1bdta0a/mira_murati_says_openai_plans_to_release_sora/

 

2024-03-15 10:326994

评论

发布
暂无评论

Hive UDF,就这

华为云开发者联盟

sql 函数 UDF Hive UDF 用户自定义函数

性能场景之压测策略设计

zuozewei

性能测试 性能分析 1月月更

前端质量提升利器-马可代码覆盖率平台

vivo互联网技术

前端 代码 平台架构

专家带你吃透 Flink 架构:一个新版 Connector 的实现

腾讯云大数据

flink 流计算 Oceanus

【工具推荐】Github国内访问速度太慢?一招教你轻松搞定

恒生LIGHT云社区

GitHub

EventBridge 最佳实践场景:流计算 Oceanus 告警消息实时推送

腾讯云大数据

flink 流计算 Oceanus

十三部门修订发布《网络安全审查办法》,企业数据安全合规应尽早

行云管家

云计算 互联网 网络安全 数据安全

AI开发平台系列2:集成式机器学习平台对比分析

Baihai IDP

AI

java开发框架Redis之sentinel和集群

@零度

redis JAVA开发

魔电熊户外电源体验|让户外露营实现用电自由!

科技热闻

SAP HANA Delivery Unit概念简述

汪子熙

数据库 内存数据库 1月月更

图形测试分析毫无头绪?HarmonyOS图形栈测试技术帮你解决|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

开源堡垒机可以一直免费使用吗?为什么?

行云管家

开源 网络安全 堡垒机

云单元架构,如何赋能数字化转型呢?

博文视点Broadview

Linux之chown命令

入门小站

Linux

在线CSS代码压缩美化工具

入门小站

工具

有道围棋 AI:智能匹配儿童棋力的良师益友

有道技术团队

网易有道 围棋

Vue的动态组件 & 异步组件

编程江湖

Vue

谁说count(*) 性能最差,我需要跟你聊聊

华为云开发者联盟

函数 count 字符 数据表

kafka的优缺点都有那些

编程江湖

kafka

前端开发之CSS样式——自定义滚动条

@零度

CSS 前端开发

有了这个新特性,一扫实例存储数据丢失风险!

亚马逊云科技 (Amazon Web Services)

存储

网络安全好学吗?手把手教你学利用漏洞渗透 网络安全工程师学习资料汇总

学神来啦

Apache Flink 不止于计算,数仓架构或兴起新一轮变革

Apache Flink

大数据 flink 编程 实时计算 流式数仓

快来一起玩转LiteOS组件:RHas

华为云开发者联盟

C语言 LiteOS 组件 RHas 哈希函数库

利用Graviton2和CloudFront为S3对象存储动态生成缩略图

亚马逊云科技 (Amazon Web Services)

存储

美团李凯揭秘数据库发展三大趋势 | TiDB Hackathon 评委访谈

PingCAP

阿里副总裁浅雪对话VMware全球副总裁原欣:阿里云携手VMware,助力企业数字化转型

大咖说

云计算 阿里云 数字化转型 阿里巴巴‘

手把手教你使用 Timestream 实现物联网时序数据存储和分析!

亚马逊云科技 (Amazon Web Services)

存储

二哥的小破站终于上线了,颜值贼高!

沉默王二

Java 分布式

大数据开发之Hive表数据同步至HBase

@零度

大数据 hive HBase

OpenAI Sora发布时间“定档”,可能允许内容中出现裸体_生成式 AI_Tina_InfoQ精选文章