免费下载!由 O’Reilly 出版的《NGINX 完全指南》中文版已正式上线 了解详情
写点什么

生成式 AI 站上风口:硅谷押注,未来科技巨头将洗牌?

  • 2022-11-04
    北京
  • 本文字数:3567 字

    阅读完需:约 12 分钟

生成式AI站上风口:硅谷押注,未来科技巨头将洗牌?

生成式 AI 越来越火,这真的是门好生意吗?


最近一段时间,AI 绘画实火。


输入一些单词,AI 就能在几秒钟内生成一张与单词相符的图像,这些图像天马行空,有些甚至十分离奇,比如:人的手上有多余的手指,手指的弯曲很不自然。甚至,AI 还能生成一些没有意义的告示牌,以及人类未曾见过的字母表。


虽然 AI 画得十分离谱,但却掀起了一股科技浪潮:生成式 AI 的春天来了。


NextView Ventures 的风险投资家 David Beisel 表示,在过去的三个月里,“生成式 AI”这个词一度变成了热门词汇。并且,生成式 AI 技术发展迅速,市场热情高涨,以至于很多人甚至辞掉工作,专门在该领域创业。


毫无疑问,在过去五年左右的时间里,AI 一直处于繁荣发展阶段,但过去的这些进步大都与理解现有数据有关——比如,AI 模型已经能够快速、高效地识别你的手机照片里是否只有猫。但是,生成式 AI 模型生成的是以前从未有过的全新事物,换句话说,生成式 AI 不仅仅是分析现有数据,而是创造。


Craiyon 生成式 AI 的创始人 Boris Dayma 认为,“生成式 AI 不仅仅是在创造旧图像,还创造了很多新事物,这些与我们以前看到过的完全不同。”


红杉资本也在其网站上的一篇博文中表示:“生成式 AI 具备创造数万亿美元经济价值的潜力。”红杉资本预测,从游戏到广告业,再到法律界,生成式 AI 可能会改变所有需要人类创造原创作品的行业。值得一提的是,红杉资本还在博文中指出,这条消息部分是由 GPT-3 撰写的(GPT-3 是一种能够生成文本的生成式 AI)。

生成式 AI 的工作原理



在过去,大家广泛使用深度学习技术,让模型能够在大型数据集上训练,当程序理解这些数据中的关系时,该模型便可应用在实际场景中,如识别一张图片中是否有条狗,或翻译文本,等等。


而图像生成器的工作原理是将这一过程反过来进行。举个例子,它不是将英语翻译成法语,而是将英语短语翻译成图像。具体来说,它通常有两个主要部分,一个是处理初始短语,另一个是将数据转换成图像。


起初,生成式 AI 基于一种叫做 GAN 的方法,即生成式对抗网络(generative adversarial network)。本质上,这种方法是通过让两个人工智能模型相互竞争,以更好地创建符合目标的图像。


目前,生成式 AI 通常基于 Transformer,比如图像生成器 DALL-E 等等。DALL-E 最早由 OpenAI 在 2021 年打造,2022 年,OpenAI 又发布了 DALL-E 2。


专注于生成式 AI 的开发人员 Christian Cantrell 表示:“有了 DALL-E 2,我们真的可以跨越恐怖谷了。”(恐怖谷理论是一个关于人类对机器人和非人类物体的感觉的假设,它在 1970 年由日本机器人专家森昌弘提出。)


另一个常用的基于 AI 的图像生成器是 Craiyon(此前曾被称为 DALL-E Mini),用户可以在浏览器中输入短语,并在几分钟内看到它生成的插图。


据 Dayma 称,自 2021 年 7 月推出以来,Craiyon 每天生成约 1000 万张前所未有的图片,加起来有 10 亿张。在今年早些时候,Craiyon 的使用量飙升,Dayma 也将 Crayon 作为自己的全职工作。此外,Dayma 还创建了一个推特账户,专门发布 Craiyon 生成的最怪异、最有创意的图片,例如,意大利水槽上的水龙头流出来的是番茄酱。



此外,Stable Diffusion 也同样受到了广泛关注,该项目发布于今年 8 月,并已在 GitHub 上开源,开发者可以在电脑上运行该项目,而不仅仅是在云端或者通过编程接口来运行。例如,Stable Diffusion 可以通过插件方式集成到 Adobe Photoshop 中,允许用户生成背景和图像的其他部分,并在应用程序中使用图层和其他 Photoshop 工具进行操作。


该插件的开发者 Cantrell 说:“我想见见这些创意专业人士,想让他们能够将人工智能引入自己的创意工作中,而不是破坏他们的工作。”


据了解,Cantrell 曾在 Adobe 公司工作长达 20 年。2022 年离职后,Cantrell 专注于生成式 AI 方向。Cantrell 表示,Stable Diffusion 已被下载数万次,艺术家们告诉他,他们将这个插件用在了很多他意想不到的地方,比如制作哥斯拉(Godzilla)的动画,或者创作蜘蛛侠的图片。

创业公司扎堆


一些投资者将生成式 AI 视为一种潜在的变革性转变,就像智能手机或互联网的早期发展一样。这类转变极大地扩大了该技术的潜在市场。


“在此之前,人工智能并不是没有出现过。在 2007 年之前,我们也不是没有移动设备,”种子投资者 Beisel 表示,“但就在这一刻,一切都汇聚到了一起。最终消费者可以体验、看到与以前不同的东西。”


Cantrell 认为,机器学习类似于一种更加基础的技术:数据库。“机器学习有点像数据库,数据库对网络应用程序来说,开启了全新的世界。我们在生活中使用过的所有应用程序,都建立在数据库之上。但没有人关心数据库是如何工作的,人们只知道如何使用它。”


Compound VC 的管理合伙人 Michael Dempsey 表示,在过去,实验室技术进入主流“非常罕见”,而目前,生成式 AI 已经吸引了风险投资者的广泛关注。尽管如此,他警告说,当前的生成式 AI 可能正处在接近炒作周期高峰的“好奇阶段”,在这个阶段成立的公司可能会失败,因为他们没有将重点放在企业或者消费者愿意支付的具体用途上。


其他业内人士认为,今天能够应用生成式 AI 这些新技术的初创公司,在未来也许会向谷歌、Meta 和微软这些科技巨头们发出挑战。


当前,很多应用生成式 AI 技术的公司已经拿到了大额融资,估值也水涨船高。 比如,今年早些时候,Hugging Face 在拿到包括 Lux Capital 和红杉资本在内的投资后,估值达到了 20 亿美元;OpenAI 也已经从微软和 Khosla Ventures 那里获得了超过 10 亿美元的资金。


此外,据《福布斯》报道,Stable Diffusion 的开发商 Stability AI 正在与投资机构洽谈,计划筹集高达 10 亿美元的风投资金。

云厂商和芯片厂商将会受益


除了初创公司,亚马逊、微软和谷歌等云服务提供商也可以从中受益,因为生成式 AI 可能需要巨大的计算量。


Meta 和谷歌也已经行动起来,开始招聘人才。今年 9 月,Meta 发布了一款名为“Make-A-Video”的人工智能应用,该应用能够生成视频,这使得生成式 AI 技术更进一步。


“这是非常了不起的进步,”Meta 首席执行官扎克伯格在他的 Facebook 页面上发帖称,“生成视频要比生成照片难多了,因为除了要正确生成每个像素外,系统还必须预测它们会随着时间的推移发生怎样的变化。”


近日,谷歌与 Meta 进行了匹配,发布了一个名为 Phenaki 的程序代码,该程序也能将文字转化为视频,并能生成几分钟的镜头片段。


这股热潮也可能会提振 Nvidia、AMD 和英特尔等芯片制造商,因为这些公司生产的先进图形处理器是训练和部署人工智能模型的理想选择。


在最近的一次会议上,Nvidia 首席执行官黄仁勋强调,生成式人 AI 是该公司最新芯片的关键用途,他表示,这种程序可能很快就会“革命性地改变通信”。


当前生成式 AI 能够产生商业利益的用途并不多。今天很多令人兴奋的突破,都是来自免费或低成本的实验。例如,一些作家就已经尝试使用图像生成器为文章生成图像。Nvidia 的一个实例是使用一个模型来生成新的 3D 图像,包括人、动物、车辆或家具,这些 3D 图像可以填充到虚拟游戏世界。

伦理问题不容忽视


生成式 AI 让行业兴奋的同时,其带来的伦理问题同样值得关注。


首先是就业问题。与专业插画师相比,生成式 AI 显然成本更低,因此,生成式 AI 很可能会抢了艺术家、视频制作者和其他从事创造性工作的人的“饭碗”。


另外,生成式 AI 创作的内容在原创性和所有权上也存在复杂的问题。


生成式 AI 是在大量的图像上训练出来的。因此,原始图像的创作者是否对生成的新图像有版权要求,这一点仍在争论之中。


前段时间,一位艺术家在科罗拉多州的艺术比赛中获胜,而他获胜的图像正是由一个名为 MidJourney 的生成式 AI 创造的。这位艺术家在获胜后接受采访时说,他是从自己生成的数百张图像中选择一张图像,并在 Photoshop 中进行了后期处理。


值得一提的是,一些由 Stable Diffusion 生成的图像带有水印,这表明一部分原始数据集是有版权的。此前,Getty Images(一家位于美国西雅图的图片交易公司)宣布禁止用户将生成的 AI 图片上传到其图片库,因为该公司担心,这类图片可能存在一定的版权问题。。


随着图像生成软件越来越好,生成式 AI 也有可能欺骗用户,让用户相信虚假信息,或者显示从未发生的事件的图像或视频。


此外,开发人员还必须应对这样一种可能性,即在大量数据上训练的模型可能会有与数据中包含的性别、种族或文化有关的偏见,这可能导致模型在其输出中显示出这种偏见。


作者简介:


Kif Leswing,CNBC 的科技记者,主要关注苹果公司、硬件和其他各种话题。拥有欧柏林学院(Oberlin College)的经济学学位。他在包括《商业内幕》、《连线》和 Gizmodo(一个报道消费电子产品相关信息的流行科技博客)在内的媒体上报道科技行业长达七年之久。


原文链接:


https://www.cnbc.com/2022/10/08/generative-ai-silicon-valleys-next-trillion-dollar-companies.html

2022-11-04 08:103800

评论

发布
暂无评论
发现更多内容

Webpack构建速度优化

Geek_02d948

webpack

Koordinator 1.0 正式发布:业界首个生产可用、面向规模场景的开源混部系统

云布道师

云原生 云栖大会

Node.js实现大文件断点续传

coder2028

node.js

webpack实战,手写loader和plugin

Geek_02d948

webpack

2022VDC云与基础架构专场:筑牢云原生与基础架构发展基石 多维助力效能提升

Geek_2d6073

Pipy:保护 Kubernetes 上的应用程序免受 SQL 注入和 XSS 攻击

Flomesh

程序员 微服务 服务网格 Pipy

合约广告平台架构演进实践

百度Geek说

业务架构 企业号十月 PK 榜 广告B端系统

java培训学习机构怎么选择

小谷哥

细说js变量、作用域和垃圾回收

hellocoder2029

JavaScript

推动中小企业数字化转型,终于“有据可依”了

雨果

低代码 数字化转型

【电商实战01】如何快速编写api层和model层?

王中阳Go

golang 高效工作 学习方法 11月月更 电商实战

大数据培训的前途怎么样

小谷哥

Webpack配置实战

Geek_02d948

webpack

JS词法环境和执行上下文

hellocoder2029

JavaScript

HDC2022 HarmonyOS学生公开课第二届成功举办,年轻创新力量生生不息!

科技汇

web3.0区块链挖矿游戏dapp系统开发合约定制(成熟技术)

开发微hkkf5566

IM通讯协议专题学习(一):Protobuf从入门到精通,一篇就够!

JackJiang

网络编程 即时通讯 IM

高并发系统谨防被一行日志击垮

小小怪下士

Java 程序员 高并发

说说Nodejs高并发的原理

coder2028

node.js

说说Nodejs高并发的原理

coder2028

node.js

自学前端没有找到工作,怎么做呢

小谷哥

JS知识点梳理之作用域、作用域链、柯里化、闭包

hellocoder2029

JavaScript

web前端培训班学习前景怎么样

小谷哥

一个 MySQL 隐式转换的坑,差点把服务器整崩溃了

Java全栈架构师

Java MySQL 数据库 程序员 后端

Java Web(二)MyBatis

浅辄

Java web mybaits 11月月更

BSC/BNB链质押挖矿dapp系统开发(案例演示)

开发微hkkf5566

高频数采、实时流计算:EMQ储能可预测维护系统方案|智慧工厂系列专题06

EMQ映云科技

物联网 IoT emqx 11月月更 云边协同

2022VDC游戏生态专场:打造更健康长久的游戏生态

Geek_2d6073

大数据培训和自学哪个好

小谷哥

解密负载均衡技术和负载均衡算法

京东科技开发者

负载均衡 算法 负载均衡算法 注册表 负载均衡技术

生成式AI站上风口:硅谷押注,未来科技巨头将洗牌?_开源_Kif Leswing_InfoQ精选文章