写点什么

“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发

  • 2024-04-16
    北京
  • 本文字数:4447 字

    阅读完需:约 15 分钟

大小:2.22M时长:12:57
“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发

“基本上以后不会存在‘程序员’这种职业了,因为只要会说话,人人都会具备程序员的能力。”百度创始人、董事长兼 CEO 李彦宏在 3 月份接受央视采访时表示。


而在 4 月 16 日的 2024 百度 Create 开发者大会上,李彦宏再次强调了这个观点:“过去,开发者用代码改变世界;未来,自然语言将成为通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界”。


李彦宏以百度为例介绍道,基于文心大模型的智能代码助手 Comate 已经编写了百度内部四分之一的代码,而百度每天的新增代码中,27%是由 Comate 自动生成。Comate 也已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了 46%。


据悉,Comate 支持 100 多种语言和所有的 IDE 平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码等。


“今天,你不会写代码,也可以做出一个应用;不用编程,也可以做出一个智能体。AI 正在掀起一场创造力革命,未来开发应用就会像拍短视频一样简单,人人都是开发者,人人都是创造者。”李彦宏说道。




那么,李彦宏具体要如何淡化程序员边界、降低开发者门槛呢?


“开源模型会越来越落后”


“开源模型会越来越落后。”李彦宏在现场表示。




李彦宏解释称,因为有了最强大的基础模型文心 4.0,用户可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。“所以开源模型会越来越落后。”


另外,李彦宏也提到,多模态大模型是通往 AGI 的必经之路,而视觉大模型最大的应用场景是自动驾驶。




李彦宏介绍了文心大模型的最新进展。他表示,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到 98.8%,推理性能提升了 105 倍,推理的成本降到了原来的 1%。也就是说,客户原来一天调用 1 万次,同样成本之下,现在一天可以调用 100 万次。


据悉,文心一言从去年 3 月 16 日首发至今,用户数突破了 2 亿,每天 API 的调用量突破 2 亿,服务企业达到 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。




另外,根据过去一年的实践,百度分享了开发 AI 原生应用的三个具体思路:


第一是 MoE。未来大型的 AI 原生应用基本都是 MoE 架构,这里所说的 MoE 不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,需要针对应用的不同场景做匹配。


第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过 SFT 精调后的小模型,它的使用效果可以媲美大模型。通过大模型压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。


第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。


百度本次的正式产品发布,基本也是围绕上述思路进行的。


如何让“人人都是开发者”?


“人人都可以成为开发者”不能成为一个口号,必须有能让开发者随取随用的工具支撑才能实现。为此,百度推出了文心大模型 4.0 工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和模型定制工具 ModelBuilder 三大工具。


AgentBuilder:智能体开发


“智能体可能是未来离每个人最近、最主流的大模型使用方式。基于强大的基础模型,智能体可以批量生成,并应用在各种各样的场景。”李彦宏说道。


作为基于文心大模型的智能体构建平台,AgentBuilder 为开发者提供了零代码和低代码两种低成本智能体开发模式。开发者可以根据不同行业领域、应用场景,调用平台提供的多样化工具,打造大模型时代的原生应用。无论是专业开发者还是新手,仅用“一句话”就创建智能体。


据悉,截至目前,已经有 3 万多个智能体被创建、5 万多名开发者和上万家企业入驻。


大会现场,李彦宏演示了启德教育等智能体案例。启德教育利用百度的 AgentBuilder 打造专属智能体,上线第一周,就成功分发了 155 万次,与用户交互了 5.8 万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    李彦宏称,“每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体。”


    

    另外,百度文心智能体平台,已经打通了“流量变现”的通路。通过接入智能体的相关能力,解决流量分发的难题,目前除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体了。


    也就是说,AgentBuilder 不止是开发平台,开发者还可以通过百度生态矩阵分发路径,做到“开发+分发+运营+变现”一体化。未来,百度还将接入商业插件功能,进一步实现商业闭环。

    AppBuilder:AI 原生应用开发


    “AppBuilder 是目前最好用的 AI 原生应用开发工具。”李彦宏说道。


    在 AppBuilder 上,百度提前封装和预置了开发 AI 原生应用所需的各种组件和框架,如知识问答类的 RAG、具备运算能力的代码解释器、生成式数据分析 GBI 等,开发者最快只需要三步就可以用自然语言开发出一个 AI 原生应用,并且能够便捷地发布到各种各样的业务环境中,甚至“无需写一行代码,就能开发出 AI 原生应用”。


    这对应了李彦宏说的:“大模型本身并不创造价值,基于大模型创造出来的应用才真正有价值。”


    

    李彦宏指出,AppBuilder 拥有两大优势:


    • 一是功能强大。依托文心 4.0 对指令的理解和遵循能力,AppBuilder 能保证冷启动就达到一定水平,不会因为效果差再花很长时间去调优;依托检索增强技术(RAG),在知识问答等典型场景,问答准确率和友好回复程度都达到了 95%以上,大幅超越其他同类产品。AppBuilder 还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的 AI 能力组件、大模型能力组件,还有百度独家开放的业务组件等 55 个组件。此外,AppBuilder 还提供一些主流场景的第三方 API,比如航班查询、论文查询等,以及自定义组件,客户可以直接对接自己专有的任何工具和数据。


    • 二是简单易用。使用 AppBuilder,只需三步即可快速创建应用、一键分发。我们也支持开源的 SDK,方便大家进行二次开发。”


    ModelBuilder:定制各种尺寸模型


    ModelBuilder 是一款适合专业开发者使用的工具,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调 SFT,这样就能达到更好的效果。


    对开发者来说,用好大模型很重要的一件事,就是掌握模型精调的方法。ModelBuilder 提供了包括文心大模型系列在内的 77 款精选大模型和全流程的模型工具链,同时提供丰富的 SDK 及全栈 API 能力,能够完成一站式的模型精调,此外还提供模型精调样板间,开发者只需要跟着样板间一步一步精调,就能做出一模一样的专业模型。


    这样,开发者可以根据需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。


    现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      他还在现场与小度实时互动,展示小度用多个模型组合的方式来执行不同任务。例如使用小模型 ERNIE Tiny 执行模型路由工作,而性能最好的文心 4.0 则用来执行日程安排等复杂需求。据介绍,相比全部使用文心大模型的旗舰版,小度可以实现响应速度提升 2 倍,成本下降 99%。


      李彦宏表示,“这几个关于 ModelBuilder 的例子,展示的是百度高效低价生产模型的能力”。


      据悉,ModelBuilder 截至目前已经服务了 8.5 万企业客户,累计精调超过 1.4 万个模型,开发超过 19 万个应用。


      “市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。”李彦宏说道。


      “我们需要一个全新的操作系统”

      

      “编程不再是少数经过专业训练的程序员的特权,相反,人人都是开发者。”


      “编程不再需要从 c/c++学起,而是从自然语言开始。”


      “编程不再是面向过程、面向对象,而是面向需求,以后,编程的过程,就是一个人表达愿望的过程。”


      百度执行副总裁、百度智能云事业群总裁沈抖在 2024 百度 Create 开发者大会上强调。


      沈抖表示,这是革命性的变化,它会彻底颠覆原有的操作系统。


      在操作系统的内核中,底层的硬件从以 CPU 算力为主变成以 GPU 算力为主,而且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。操作系统管理的对象也因此发生了本质的变化,从管理进程、管理微服务,变成了管理智能。


      “传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统。”沈抖认为,这个全新的操作系统需要管理万卡规模的集群,需要极致发挥 GPU、CPU 的性能、高速互联,需要有强大的大模型作为核心引擎,包括语言大模型、视觉大模型等,这些构成了操作系统的内核。

       

      在内核层之上,这个操作系统还需要构建起强大的大模型服务能力,提供全面的模型精调、评估、部署、调用等工具链;还需要有好的应用开发工具去做工作流编排、插件管理;还有必不可少的安全和运维,隐藏掉上一代云原生系统的复杂性。


      基于上述思考,沈抖宣布推出新一代智能计算操作系统——万源。“软件定义世界,万源用自然语言定义软件。”沈抖说道。


      

      据介绍,万源操作系统主要由 Kernel(内核)、Shell(外壳层)、ToolKit(工具层)组成。


      万源的内核层既包含了业界领先的 ERNIE 4.0、3.5 大语言模型、也包括 ERNIE Speed/Lite/Tiny 系列轻量模型,此外还包括文心视觉大模型和第三方大模型。


      

      另外,考虑到芯片供应不确定性带来的多款芯片并存格局,为管理好多个厂商、不同代际的芯片,百度的百舸平台实现了百卡规模、单一训练任务下,不同厂商芯片的混合训练,并且把训练的性能损失控制在 3%,千卡规模的性能损失也不超过 5%。百舸屏蔽掉了芯片之间的差异,给用户自由选择不同芯片组合的权力。


      内核之上是千帆 ModelBuilder,负责内核中模型的管理、调度、二次开发。ModelBuidler 提供的模型路由服务,可以自动给不同难度的任务选择最合适的模型,实现效果与成本的最优组合,在效果基本持平的情况下,平均降低 30%的推理成本。


      工具层方面,千帆 AppBuilder 和 AgentBuilder 则是强大的应用开发平台。


      此外,百度还发布了全球首个 AI 原生操作系统 DuerOS X,该系统基于文心大模型全面焕新,在多模态感知、拟人化呈现上有重要升级,小度的人机交互体验将迎来质的飞跃。


      结束语


      “人人都可以成为开发者,未来必将是一个由开发者一起创造出来的未来。”李彦宏表示。那么未来,百度能否真正实现这个理想,我们拭目以待。


      2024-04-16 14:078364

      评论 11 条评论

      发布
      用户头像
      阿里大忽悠说工号AI001的AI码农,KPI是写完公司20%代码,那么是否5个AI就能完成阿里的100%的代码,阿里云的上万名员工要失业了,😄
      2024-04-24 10:36 · 上海
      回复
      用户头像
      如果真这么牛逼直接介入芯片制造了,问问 ai 怎么造出1nm 的光刻机
      2024-04-23 11:58 · 福建
      回复
      用户头像
      有个问题,ai一天能写十万行代码,谁来审核呢?ai写的程序出了问题,谁背锅,ai背吗?
      2024-04-22 11:06 · 北京
      回复
      用户头像
      和无代码开发这么像。
      2024-04-21 07:39 · 北京
      回复
      用户头像
      百度就是个笑话
      2024-04-20 08:43 · 广东
      回复
      用户头像
      代码采纳率99%能干啥,缺了1%都不能工作
      2024-04-19 14:25 · 广东
      回复
      用户头像
      做的东西不咋滴,吹牛当当响
      2024-04-19 10:03 · 上海
      回复
      用户头像
      李艳红被手下忽悠的够呛,难怪被BAT除名,信誓旦旦一本正经的胡说八道
      2024-04-19 09:19 · 北京
      回复
      李艳红,我要用你的问心生成个千度
      2024-04-19 09:21 · 北京
      回复
      用户头像
      错别字

      相应

      2024-04-17 17:16 · 北京
      回复
      用户头像
      喜马拉雅这个手机晃一晃就跳广告的流氓,有什么脸用先进技术。不是技术的事,懂吗?
      2024-04-16 14:19 · 四川
      回复
      没有更多了
      发现更多内容

      GitHub开源的最全中文诗歌古典文集数据库

      不脱发的程序猿

      GitHub 开源 程序人生 中华古典文集数据库

      架构实战营模块三作业

      日照时间长

      架构实战营

      【LeetCode】解码异或后的数组Java题解

      Albert

      算法 LeetCode 5月日更

      回顾 Alex Smola 讲述的“自动化机器学习(AutoML)”,本文带你了解 AutoGluon!

      亚马逊云科技 (Amazon Web Services)

      高并发之存储篇:关注下索引原理和优化吧!躲得过实践,躲不过面试官!

      Coder的技术之路

      数据库 高并发 索引结构 索引优化

      流媒体:依托于声网的连麦解决方案

      小岛上的黑桃六

      架构 音视频 架构师 流媒体 声网

      百分点大数据技术团队:政务数据安全管理实践

      百分点大数据团队

      【案例】新基建下星环科技城轨智能视频分析系统建设

      星环科技

      LiteOS内核源码分析:静态内存Static Memory

      华为云开发者联盟

      内存管理 LiteOS 静态内存 Static Memory Membox

      负载均衡续:万亿流量场景下的负载均衡实践

      Coder的技术之路

      负载均衡 架构 高并发 负载均衡架构

      云图说|云数据库MySQL内核小版本升级全攻略

      华为云开发者联盟

      MySQL 云数据库 内核 华为云数据库 小版本升级

      不反粘水性台板胶Waterborne table glue

      C13713145387

      不反粘水性台板胶

      聊聊我的编程时如何入门的

      C语言与CPP编程

      c++ 编程 程序人生 C语言 数据结构与算法

      弹力抗刮硅油布胶浆

      C13713145387

      弹力抗刮硅油布胶浆

      华云大咖说 | 安超DCM给数据中心“做主”

      华云数据

      Flink on Zeppelin 系列之:Yarn Application 模式支持

      Apache Flink

      flink

      INNOVATE 2021 圆满落幕,一起盘点那些 AI 前沿实例!

      亚马逊云科技 (Amazon Web Services)

      高并发系列:架构优化之从BAT实际案例看消息中间件的妙用

      Coder的技术之路

      高并发 高并发系统设计 消息队列 消息中间件

      Android中绘制圆角的三种方式

      teoking

      android

      大四实习生”都四面成功拿到字节跳动Offer了,你还有什么理由去摸鱼?

      学Java关注我

      Java 编程 架构 面试 计算机

      夏季不塞网胶浆、夏季不堵网胶浆

      C13713145387

      夏季不塞网胶浆

      一文抽丝剥茧带你掌握复杂Gremlin查询的调试方法

      华为云开发者联盟

      调试 图数据库 Gremlin 遍历源 图遍历

      用机器学习操控无人驾驶小车,竟然和训练狗狗的原理一样!?

      亚马逊云科技 (Amazon Web Services)

      高并发系列:存储优化之也许可能是史上最详尽的分库分表文章之一

      Coder的技术之路

      高并发 分库分表 高并发系统设计

      从简历被拒到收割8个大厂offer,我用了3个月成功破茧成蝶

      比伯

      Java 编程 架构 面试 计算机

      万丈高楼平地起,爆肝21000字Java基础知识总结,收藏起来总有用得着的时候

      北游学Java

      Java 集合 线程池 IO流

      专家解惑 | 关于华为云盘古大模型,你想问的都在这里~

      华为云开发者联盟

      计算机视觉 nlp 华为云 盘古大模型 预训练

      Java面试:BIO,NIO,AIO 的区别,别再傻傻分不清楚

      Java大蜗牛

      Java 程序员 面试 编程语言 后端

      立体水性石头拉浆

      C13713145387

      水性硅胶防滑透明浆

      C13713145387

      水性硅胶防滑透明浆

      GitHub Actions:真正的 DevOps CI

      大龄程序员老羊

      架构 DevOps 持续集成 Github Actions NoOps

      “干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发_百度_褚杏娟_InfoQ精选文章