QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

第四范式入局 AI 大模型!「式说 3.0」正式亮相,参数不固定,断网也能跑

  • 2023-04-28
    北京
  • 本文字数:2015 字

    阅读完需:约 7 分钟

第四范式入局AI大模型!「式说3.0」正式亮相,参数不固定,断网也能跑

4 月 26 日,第四范式首次向公众展示其大模型产品「式说 3.0」,并首次提出 AIGS 战略(AI-Generated Software):以生成式 AI 重构企业软件。式说将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现「AIGS」。


媒体会现场,第四范式创始人、首席执行官戴文渊现场拔网线(切断公网,访问内网集群)测试了式说大模型在图片理解、多轮对话、图片代码、生成代码、逻辑推理上的能力。


戴文渊认为,目前这些 B 端软件极为复杂的交互体验,以及复杂性带来的极低开发效率,恰恰为生成式AI留下足够大的重构和改造空间。


“过去很难通过人类语言(自然语言)的方式去调用企业软件的功能,现在当我们有更强的语义理解和生成能力,再加上 GPT 任务翻译、任务分发和推理的能力,就可以通过更好的**「对话框式」交互方式**实现功能的调用,不再需要找到某个位于十几级的菜单目录之下的功能。”在展示大模型能力时,第四范式在现场拔断网线,在未联网的情况下式说大模型展示了其图片理解、多轮对话、写小说、迅速画图等能力。



此外,现场展示了式说通过推理能力完成更加复杂的“装箱”操作,以及其现场编写代码的能力。



在戴文渊看来,要做到 AIGS,大模型未必需要是知识广博、十项全能冠军的通才,更重要的在于模型具备 Copilot(副驾舱),和思维链 CoT(chain of thoughts,多步推理)的能力。


“要去改造企业软件,大模型不能只有语言能力。式说 2.0 就加入了多模态和 Copilot,因为很多企业软件里的数据是多模态的,而 Copilot 能把人的指令翻译成要调用后台的哪个 API。”此前发布的式说 2.0 的 Demo 中,门店员工通过语音、文本等交互方式向式说发起指令,式说理解后,联网门店监控软件调出后厨未戴口罩的图片,并直接将图片以对话框的形式输出给员工。


大模型去调用软件内置的一个个功能、数据来「对话框式」完成任务,已经能产生巨大价值。但员工用企业软件时也会面临复杂任务,需要人按照顺序执行一个个功能。


因此,式说 3.0 强调的是 Copilot 加上思维链 CoT,具有更强的推理能力,在学习大量数据和“攻略”后,能形成中间的逻辑推理步骤,从而做到拆分并执行复杂工作。


会后,在问及式说 3.0 的具体参数时,第四范式创始人、CEO 戴文渊表示,目前“式说”没有固定的参数,最高达到千亿个。


参数量其实是一个辩证的问题,我们没有一个固定的参数,给到不同客户的参数量也是不一样的,会根据客户不同场景,可能会有几十亿、几百亿参数版本。千亿万亿参数只是代表你最高的能力,但高参数意味着思维能力要求更高、算力高,而客户场景不一定需要这么高的算力要求,因为不是所有场景都能接受千亿参数量成本,所以客户要选择(大模型)。”戴文渊强调,此前 B 端的企业级软件的交互体验极为复杂,拉低了产品开发效率,如今生成式 AI(AIGC)对 B 端软件重构和改造空间足够大。“式说”每天都在进步。

首提 AIGS 战略:以生成式 AI 重构企业软件

ChatGPT 发布后,国内外科技巨头争相入局大模型赛道。国内百度、商汤、科大讯飞等均发布了自己的 AIGC 产品,那么,此次第四范式「式说 3.0」有什么不一样?


戴文渊表示:“中国目前还没有像 OpenAI 那样在大模型上绝对领先的公司,也会有更多的大模型。大模型是新的生产力,大家都得有大模型作为底座,所以入局的门槛确实是变高了。但是在达到这个门槛之后,重点在于如何选择方向。比如培养了一个大学生后,到公司再接受专业的训练,在某一个领域积累专业的能力,这是很重要的。但不具备一定的素质有很多事就干不了,所以底层的大模型也很重要。”


因此,第四范式认为比较大的机会在于改造整个的企业软件行业,也就是 AIGS 这个方向。发力的大模型技术方向是 Copilot 可控(执行可控、知错能改),和思维链 COT((chain of thoughts,多步推理、复杂任务拆分)的能力,形成数据飞轮(比如将某垂直领域的数据和流程投入大模型,很快可以形成模型在该领域的思维链)。


第四范式将 AIGS 的路径总结为三个阶段:


第一阶段,Copilot 调动不同的信息、数据、应用,作为助手完成用户的指令。相当于在所有企业级软件系统里,配备一个指挥官。指挥官听用户的指挥,比如“把照片亮度调亮 20%”。


第二阶段,Copilot+基于企业规则的“知识库”,AI 能够参照规则做复杂工作,进一步丰富了「对话框」的能力。比如 AI 查询了“人像美化”知识库后,能执行把照片修好看的步骤。


第三阶段,Copilot+CoT(思维链)。软件系统的使用行为最终会被大模型学会,形成 AI 针对这个领域的思维链,意味着“把照片处理得更好看”这种复杂指令,AI 能自动地按照步骤完成。


第四范式的 AIGS 战略,就是指基于式说大模型背后的 Copilot+COT 能力,把企业软件改造成新型的交互范式,并在新型交互上不断地学习软件的使用过程,形成领域软件的“思维链”。


除此以外,生成式 AI 对软件的改造,不仅仅体现在体验上,还体现在开发效率上。戴文渊说道,当前的软件开发,绝大多数都是以月计算时间,更复杂的软件开发可能要以年计算。但生成式 AI 改造后的软件开发,可以将这一时间维度缩短到以天计算。


2023-04-28 17:346023
用户头像
李冬梅 加V:busulishang4668

发布了 1045 篇内容, 共 658.5 次阅读, 收获喜欢 1209 次。

关注

评论

发布
暂无评论
发现更多内容

(Java开发岗)了解大厂面试基本套路及每一轮的重点

程序知音

Java 后端 java面试 java架构 互联网大厂面试

openGauss-graph 0.1.0版本正式发布

华为云桌面Workspace,让你的办公更加舒适惬意

清欢科技

Serverless Devs 重大更新,基于 Serverless 架构的 CI/CD 框架:Serverless-cd

阿里巴巴云原生

阿里云 Serverless 云原生

RocketMQ 客户端负载均衡机制详解及最佳实践

阿里巴巴云原生

阿里云 RocketMQ 云原生

面试官:介绍一下 Redis 三种集群模式

Jeremy Lai

redis集群

助推专精特新企业数字化的低代码

力软低代码开发平台

React Server Component: 混合式渲染

字节跳动终端技术

react.js 原理分析 服务端渲染 混合式渲染 Server Component

为啥PMO困惑的起因和其他职能部门不一样?

PMO实践

项目管理 PMO

华为云桌面Workspace云上办公,方便得很!

科技说

面试卡在多线程?那就分享几道Java多线程高频面试题,面试不用愁

钟奕礼

Java 程序员 java面试 java 编程

重磅来袭!爆肝一周整理的多线程&高并发笔记(含面试题+导图+笔记)

小小怪下士

Java 面试 多线程 高并发

Java实战案例-动态调色板

小院里的霍大侠

Java 实战案例 初学者 入门学习

openGauss企业级开源数据库荣获2022年度中国计算机学会(CCF)科技进步奖特等奖

京东云正式加入openGauss社区,共筑数据库科技服务供应链

openGauss的高效数据压缩算法

华为云会议助力云上办公更加容易

爱尚科技

华为云大数据轻量级解决方案,让数据“慧”说话

科技说

智慧医疗时代,如何更精准、更智能、更高品质?

澳鹏Appen

人工智能 医疗 数据标注 智慧医疗 AI医疗

同享明年,共创此时 —— GreptimeDB Roadmap 2023

Greptime 格睿科技

数据库 开源 分布式 云原生 物联网

事务

ssun

事务 JAV A 11月月更

如何拆掉跨部门的墙?

PMO实践

项目管理 企业管理 跨部门沟通

公司真的需要PMO吗?

PMO实践

项目管理 PMO

腾讯生态大会倒计时1天!

ToB行业头条

MobPush for ReactNative

MobTech袤博科技

AI/ML如何在山林防火中大显身手?

澳鹏Appen

人工智能 工业4.0 工业 数据标注 防火

WebGL入门之基于WebGL的Sovit3D可视化平台

2D3D前端可视化开发

数据可视化 WebGL 三维可视化 web3d 3d绘图引擎

Wallys/IPQ8072/IPQ8074/2x(4×4 or 8×8) 11AX/IPQ6010 (IPQ6018 FAMILY)/industrial wifi6 moudle

wallysSK

IPQ6010 ipq6018 IPQ8072 IPQ8074

金奖方案 | 一专多能、傲视寰宇,南大通用GBase8c数据库牛在哪里?

华为云会议让企业会议想开就开

爱尚科技

云渲染和渲染农场的区别在哪里?

Finovy Cloud

云计算 云渲染 渲染农场

第四范式入局AI大模型!「式说3.0」正式亮相,参数不固定,断网也能跑_AI&大模型_李冬梅_InfoQ精选文章