HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发

  • 2024-04-16
    北京
  • 本文字数:4447 字

    阅读完需:约 15 分钟

大小:2.22M时长:12:57
“干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发

“基本上以后不会存在‘程序员’这种职业了,因为只要会说话,人人都会具备程序员的能力。”百度创始人、董事长兼 CEO 李彦宏在 3 月份接受央视采访时表示。


而在 4 月 16 日的 2024 百度 Create 开发者大会上,李彦宏再次强调了这个观点:“过去,开发者用代码改变世界;未来,自然语言将成为通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界”。


李彦宏以百度为例介绍道,基于文心大模型的智能代码助手 Comate 已经编写了百度内部四分之一的代码,而百度每天的新增代码中,27%是由 Comate 自动生成。Comate 也已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了 46%。


据悉,Comate 支持 100 多种语言和所有的 IDE 平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码等。


“今天,你不会写代码,也可以做出一个应用;不用编程,也可以做出一个智能体。AI 正在掀起一场创造力革命,未来开发应用就会像拍短视频一样简单,人人都是开发者,人人都是创造者。”李彦宏说道。




那么,李彦宏具体要如何淡化程序员边界、降低开发者门槛呢?


“开源模型会越来越落后”


“开源模型会越来越落后。”李彦宏在现场表示。




李彦宏解释称,因为有了最强大的基础模型文心 4.0,用户可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。“所以开源模型会越来越落后。”


另外,李彦宏也提到,多模态大模型是通往 AGI 的必经之路,而视觉大模型最大的应用场景是自动驾驶。




李彦宏介绍了文心大模型的最新进展。他表示,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。不仅如此,相比一年前,文心大模型的算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到 98.8%,推理性能提升了 105 倍,推理的成本降到了原来的 1%。也就是说,客户原来一天调用 1 万次,同样成本之下,现在一天可以调用 100 万次。


据悉,文心一言从去年 3 月 16 日首发至今,用户数突破了 2 亿,每天 API 的调用量突破 2 亿,服务企业达到 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。




另外,根据过去一年的实践,百度分享了开发 AI 原生应用的三个具体思路:


第一是 MoE。未来大型的 AI 原生应用基本都是 MoE 架构,这里所说的 MoE 不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。但什么时候调用小模型、什么时候调用大模型、什么时候不调用模型,需要针对应用的不同场景做匹配。


第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过 SFT 精调后的小模型,它的使用效果可以媲美大模型。通过大模型压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。


第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。


百度本次的正式产品发布,基本也是围绕上述思路进行的。


如何让“人人都是开发者”?


“人人都可以成为开发者”不能成为一个口号,必须有能让开发者随取随用的工具支撑才能实现。为此,百度推出了文心大模型 4.0 工具版,包括智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和模型定制工具 ModelBuilder 三大工具。


AgentBuilder:智能体开发


“智能体可能是未来离每个人最近、最主流的大模型使用方式。基于强大的基础模型,智能体可以批量生成,并应用在各种各样的场景。”李彦宏说道。


作为基于文心大模型的智能体构建平台,AgentBuilder 为开发者提供了零代码和低代码两种低成本智能体开发模式。开发者可以根据不同行业领域、应用场景,调用平台提供的多样化工具,打造大模型时代的原生应用。无论是专业开发者还是新手,仅用“一句话”就创建智能体。


据悉,截至目前,已经有 3 万多个智能体被创建、5 万多名开发者和上万家企业入驻。


大会现场,李彦宏演示了启德教育等智能体案例。启德教育利用百度的 AgentBuilder 打造专属智能体,上线第一周,就成功分发了 155 万次,与用户交互了 5.8 万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    李彦宏称,“每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体。”


    

    另外,百度文心智能体平台,已经打通了“流量变现”的通路。通过接入智能体的相关能力,解决流量分发的难题,目前除了百度搜索,百度生态的其他产品,如小度、地图、贴吧、车机等,都能接入智能体了。


    也就是说,AgentBuilder 不止是开发平台,开发者还可以通过百度生态矩阵分发路径,做到“开发+分发+运营+变现”一体化。未来,百度还将接入商业插件功能,进一步实现商业闭环。

    AppBuilder:AI 原生应用开发


    “AppBuilder 是目前最好用的 AI 原生应用开发工具。”李彦宏说道。


    在 AppBuilder 上,百度提前封装和预置了开发 AI 原生应用所需的各种组件和框架,如知识问答类的 RAG、具备运算能力的代码解释器、生成式数据分析 GBI 等,开发者最快只需要三步就可以用自然语言开发出一个 AI 原生应用,并且能够便捷地发布到各种各样的业务环境中,甚至“无需写一行代码,就能开发出 AI 原生应用”。


    这对应了李彦宏说的:“大模型本身并不创造价值,基于大模型创造出来的应用才真正有价值。”


    

    李彦宏指出,AppBuilder 拥有两大优势:


    • 一是功能强大。依托文心 4.0 对指令的理解和遵循能力,AppBuilder 能保证冷启动就达到一定水平,不会因为效果差再花很长时间去调优;依托检索增强技术(RAG),在知识问答等典型场景,问答准确率和友好回复程度都达到了 95%以上,大幅超越其他同类产品。AppBuilder 还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的 AI 能力组件、大模型能力组件,还有百度独家开放的业务组件等 55 个组件。此外,AppBuilder 还提供一些主流场景的第三方 API,比如航班查询、论文查询等,以及自定义组件,客户可以直接对接自己专有的任何工具和数据。


    • 二是简单易用。使用 AppBuilder,只需三步即可快速创建应用、一键分发。我们也支持开源的 SDK,方便大家进行二次开发。”


    ModelBuilder:定制各种尺寸模型


    ModelBuilder 是一款适合专业开发者使用的工具,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调 SFT,这样就能达到更好的效果。


    对开发者来说,用好大模型很重要的一件事,就是掌握模型精调的方法。ModelBuilder 提供了包括文心大模型系列在内的 77 款精选大模型和全流程的模型工具链,同时提供丰富的 SDK 及全栈 API 能力,能够完成一站式的模型精调,此外还提供模型精调样板间,开发者只需要跟着样板间一步一步精调,就能做出一模一样的专业模型。


    这样,开发者可以根据需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,这样就能达到更好的效果。


    现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      他还在现场与小度实时互动,展示小度用多个模型组合的方式来执行不同任务。例如使用小模型 ERNIE Tiny 执行模型路由工作,而性能最好的文心 4.0 则用来执行日程安排等复杂需求。据介绍,相比全部使用文心大模型的旗舰版,小度可以实现响应速度提升 2 倍,成本下降 99%。


      李彦宏表示,“这几个关于 ModelBuilder 的例子,展示的是百度高效低价生产模型的能力”。


      据悉,ModelBuilder 截至目前已经服务了 8.5 万企业客户,累计精调超过 1.4 万个模型,开发超过 19 万个应用。


      “市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。”李彦宏说道。


      “我们需要一个全新的操作系统”

      

      “编程不再是少数经过专业训练的程序员的特权,相反,人人都是开发者。”


      “编程不再需要从 c/c++学起,而是从自然语言开始。”


      “编程不再是面向过程、面向对象,而是面向需求,以后,编程的过程,就是一个人表达愿望的过程。”


      百度执行副总裁、百度智能云事业群总裁沈抖在 2024 百度 Create 开发者大会上强调。


      沈抖表示,这是革命性的变化,它会彻底颠覆原有的操作系统。


      在操作系统的内核中,底层的硬件从以 CPU 算力为主变成以 GPU 算力为主,而且第一次增加了硬件和软件以外的资源,也就是被大模型压缩的世界知识。操作系统管理的对象也因此发生了本质的变化,从管理进程、管理微服务,变成了管理智能。


      “传统的云计算系统依然重要,但不再是主角,我们需要一个全新的操作系统。”沈抖认为,这个全新的操作系统需要管理万卡规模的集群,需要极致发挥 GPU、CPU 的性能、高速互联,需要有强大的大模型作为核心引擎,包括语言大模型、视觉大模型等,这些构成了操作系统的内核。

       

      在内核层之上,这个操作系统还需要构建起强大的大模型服务能力,提供全面的模型精调、评估、部署、调用等工具链;还需要有好的应用开发工具去做工作流编排、插件管理;还有必不可少的安全和运维,隐藏掉上一代云原生系统的复杂性。


      基于上述思考,沈抖宣布推出新一代智能计算操作系统——万源。“软件定义世界,万源用自然语言定义软件。”沈抖说道。


      

      据介绍,万源操作系统主要由 Kernel(内核)、Shell(外壳层)、ToolKit(工具层)组成。


      万源的内核层既包含了业界领先的 ERNIE 4.0、3.5 大语言模型、也包括 ERNIE Speed/Lite/Tiny 系列轻量模型,此外还包括文心视觉大模型和第三方大模型。


      

      另外,考虑到芯片供应不确定性带来的多款芯片并存格局,为管理好多个厂商、不同代际的芯片,百度的百舸平台实现了百卡规模、单一训练任务下,不同厂商芯片的混合训练,并且把训练的性能损失控制在 3%,千卡规模的性能损失也不超过 5%。百舸屏蔽掉了芯片之间的差异,给用户自由选择不同芯片组合的权力。


      内核之上是千帆 ModelBuilder,负责内核中模型的管理、调度、二次开发。ModelBuidler 提供的模型路由服务,可以自动给不同难度的任务选择最合适的模型,实现效果与成本的最优组合,在效果基本持平的情况下,平均降低 30%的推理成本。


      工具层方面,千帆 AppBuilder 和 AgentBuilder 则是强大的应用开发平台。


      此外,百度还发布了全球首个 AI 原生操作系统 DuerOS X,该系统基于文心大模型全面焕新,在多模态感知、拟人化呈现上有重要升级,小度的人机交互体验将迎来质的飞跃。


      结束语


      “人人都可以成为开发者,未来必将是一个由开发者一起创造出来的未来。”李彦宏表示。那么未来,百度能否真正实现这个理想,我们拭目以待。


      2024-04-16 14:078266

      评论 11 条评论

      发布
      用户头像
      阿里大忽悠说工号AI001的AI码农,KPI是写完公司20%代码,那么是否5个AI就能完成阿里的100%的代码,阿里云的上万名员工要失业了,😄
      2024-04-24 10:36 · 上海
      回复
      用户头像
      如果真这么牛逼直接介入芯片制造了,问问 ai 怎么造出1nm 的光刻机
      2024-04-23 11:58 · 福建
      回复
      用户头像
      有个问题,ai一天能写十万行代码,谁来审核呢?ai写的程序出了问题,谁背锅,ai背吗?
      2024-04-22 11:06 · 北京
      回复
      用户头像
      和无代码开发这么像。
      2024-04-21 07:39 · 北京
      回复
      用户头像
      百度就是个笑话
      2024-04-20 08:43 · 广东
      回复
      用户头像
      代码采纳率99%能干啥,缺了1%都不能工作
      2024-04-19 14:25 · 广东
      回复
      用户头像
      做的东西不咋滴,吹牛当当响
      2024-04-19 10:03 · 上海
      回复
      用户头像
      李艳红被手下忽悠的够呛,难怪被BAT除名,信誓旦旦一本正经的胡说八道
      2024-04-19 09:19 · 北京
      回复
      李艳红,我要用你的问心生成个千度
      2024-04-19 09:21 · 北京
      回复
      用户头像
      错别字

      相应

      2024-04-17 17:16 · 北京
      回复
      用户头像
      喜马拉雅这个手机晃一晃就跳广告的流氓,有什么脸用先进技术。不是技术的事,懂吗?
      2024-04-16 14:19 · 四川
      回复
      没有更多了
      发现更多内容

      我做了个《联机桌游合集: UNO+斗地主+五子棋》无需下载,点开即玩!叫上朋友,即刻开局!不看广告,不做任务,享受「纯粹」的游戏!

      HullQin

      CSS JavaScript html 前端 8月月更

      悟了,应该都了解分布式架构下负载均衡器吧

      知识浅谈

      负载均衡 8月月更

      阿里云鲍文乐:基于事件的自动化运维最佳实践

      阿里云弹性计算

      事件 自动化运维 CloudOps

      Kubernetes Kruise Rollout

      CTO技术共享

      开源 签约计划第三季 8月月更

      我眼中的无影云桌面‖云桌面使用者角度

      乌龟哥哥

      8月月更

      直播商城系统——直播和电商的合理有效结合

      开源直播系统源码

      软件开发 直播系统源码 直播带货系统 直播商城系统 直播app系统

      低代码实现探索(四十八)后端服务

      零道云-混合式低代码平台

      【精通内核】汇编下的C语言

      小明Java问道之路

      指针 C语言 结构体 汇编语言 8月月更

      圣庭医疗联合创始人谷红仓:高通量基因测序在药物研发和靶向治疗中的应用

      阿里云弹性计算

      HPC 高性能计算 生命科学 基因测序

      3 分钟温故知新 RxJS 【创建实例操作符】

      掘金安东尼

      前端 函数式编程 8月月更

      腾讯发布第二季度财报,腾讯云数据库收入同比增长超过30%

      科技热闻

      文件管理-Linux系统压缩打包

      Albert Edison

      Linux centos 文件管理 tar命令 8月月更

      自媒体代运营为何被诟病,代运营的水有多深

      石头IT视角

      Kubernetes 云原生日志构建

      CTO技术共享

      开源 签约计划第三季 8月月更

      Kubernetes 重大更改和删除

      CTO技术共享

      开源 签约计划第三季 8月月更

      云原生(二十) | 深入了解Kubernetes(k8s)Service

      Lansonli

      云原生 k8s 8月月更

      应用缺少POI数据,如何开发地点深度信息?

      HarmonyOS SDK

      五分钟给你的 gRPC 服务加上 HTTP 接口

      万俊峰Kevin

      Go 微服务 gRPC web开发 go-zero

      【Django | 开发】面试招聘信息网站(快速搭建核心需求)

      计算机魔术师

      8月月更

      【React源码系列】React Context原理,为什么我建议尽可能少的使用React Redux管理状态 审核中

      爱切图的木子老师

      react源码 react context react redux

      寻找海量数据集用于大数据开发实战(维基百科网站统计数据)

      程序员欣宸

      大数据 数据集 8月月更

      基于CC2530(ZigBee)设计的景观照明控制系统+配套手机APP

      DS小龙哥

      8月月更

      RocketMQ高可用设计之故障规避机制

      急需上岸的小谢

      8月月更

      Web登录很简单?开玩笑!

      TimeFriends

      8月月更

      Go-Excelize API源码阅读(十三)—— GetSheetVisible、SetSheetFormatPr

      Regan Yue

      Go 开源 源码解析 8月日更 8月月更

      付费会员之我见(43/100)

      hackstoic

      商业模式

      【精通内核】深入理解汇编语言

      小明Java问道之路

      指令集 寄存器 汇编语言 8月月更 机器语言

      【LeetCode】课程表Java题解

      Albert

      LeetCode 8月月更

      计算机网络(二、物理层)

      计算机网络 8月月更

      预约直播 | 基于预训练模型的自然语言处理及EasyNLP算法框架

      阿里云大数据AI技术

      深度学习 阿里云 算法框架

      C++继承中的多继承语法与菱形继承

      CtrlX

      c c++ 面向对象 继承 8月月更

      “干掉程序员”,百度是认真的!发布三大开发工具和全新操作系统,李彦宏:只要会说话就会干开发_百度_褚杏娟_InfoQ精选文章