写点什么

大语言模型席卷大厂,为什么百度能先人一步?

  • 2023-03-07
    北京
  • 本文字数:1068 字

    阅读完需:约 4 分钟

大语言模型席卷大厂,为什么百度能先人一步?

ChatGPT 的破圈爆火,把大语言模型推到风口浪尖,让百度、微软、阿里等互联网大厂纷纷瞄准这一赛道。

 

然而趋于冷静后我们能够发现,大语言模型却是一个非常“烧钱”的项目。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。由此也就不难理解,大语言模型 并不是一朝一夕就能完成的。算力作为训练的基础条件,如果不具备这一核心因素,做出大语言模型就成为了空谈。

 

那么在国内,谁将成为第一个做出大语言模型的科技大厂呢?近日,百度宣布将在 3 月 16 日围绕其生成式 AI 产品、大语言模型“文心一言”召开新闻发布会,成为全球第一个明确大语言模型产品落地时间的科技公司。

 

实际上,百度能在这波 ChatGPT 的热潮下抢占头筹也并不意外。百度深耕人工智能领域十余年,拥有芯片、框架、模型和应用四层技术栈。基于长期技术投入,百度基础能力完全具备、具有综合优势,不仅能够实现整体持平 ChatGPT,甚至还有机会做到局部超越,超越部分包括知识增强、检索增强和对话增强。

 

知识增强方面,百度文心大模型是全球首个知识增强千亿大模型,拥有世界上最大规模知识图谱,包含 50 亿实体、5500 亿级事实,每天调用量超过 400 亿次。知识图谱是以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础;检索增强则是指,在大模型底层上,搜索架构和生成式 AI 架构可以融合。搜索在真实数据和用户需求理解上具备先发优势,能提升大语言模型的准确性和实效性。

 

此外,在对话一致性、长期记忆和多轮对话丰富度上,文心一言也可能有更好的表现。百度在这方面实力显著,其“知识与深度学习融合的通用对话技术及应用”曾获中国人工智能协会吴文俊奖特等奖,是历史上首个特等奖;“百度大脑核心技术与开放平台”获中国电子学会科技进步奖一等奖;百度超级智能助手也曾获中国专利金奖。

 

接下来,百度计划将多项主流业务与文心一言整合。李彦宏在财报电话会上提到:“我们相信文心一言将改变云计算的游戏规则,人工智能正在以一种巨大的方式改变许多行业,我们对即将发生的事情感到非常兴奋。”据了解,文心一言将通过百度智能云提供服务,吸引企业和机构客户使用 API 和基础设施,共同搭建 AI 模型、开发应用,实现产业 AI 普惠。目前,已有超 500 家企业宣布加入“文心一言”生态圈。


3 月 16 日 14 点,百度计划在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。文心一言的率先推出,到底能给行业带来哪些颠覆?让我们拭目以待!


公众号推荐:

AGI 概念引发热议。那么 AGI 究竟是什么?技术架构来看又包括哪些?AI Agent 如何助力人工智能走向 AGI 时代?现阶段营销、金融、教育、零售、企服等行业场景下,AGI应用程度如何?有哪些典型应用案例了吗?以上问题的回答尽在《中国AGI市场发展研究报告 2024》,欢迎大家扫码关注「AI前线」公众号,回复「AGI」领取。

2023-03-07 14:483903

评论

发布
暂无评论
发现更多内容

国云注智,聚力向新!天翼云打造五位一体智算云能力体系!

天翼云开发者社区

云计算 算力 数字中国 云生态大会

浅谈Redis的三种集群策略及应用场景

天翼云开发者社区

集群 redis 底层原理

GPT-4o初体验:视觉、听觉跨越式升级

蓉蓉

ChatGPT gpt4o

AI数字人本地算力直播怎么做?青否数字人教您快速搭建直播间!

青否数字人

数字人

基于SkyEye运行Qt:著名应用程序开发框架

DevOps和数字孪生

qt SkyEye

麦当劳元宇宙在新加坡首次亮相

区块链开发团队DappNetWork

YashanDB携手宏杉科技助力国产软件生态发展

Geek_2d6073

刷新方盒子最快10万销量纪录 捷途旅行者何以颠覆越野市场?

Geek_2d6073

手把手教你用Spring Boot搭建AI原生应用

百度Geek说

企业号 6 月 PK 榜 AI原生应用 Spring AI

linux各个目录的作用

天翼云开发者社区

Linux 目录

MySQL Shell 使用指南

Simon

MySQL mysqlshell

K8s的Pod资源对象如何实现微服务架构?

OSCTraining

pod #k8s 源来如此公开课

如何创建一个线程池,为什么不推荐使用Executors去创建呢?

EquatorCoco

Java 多线程 开发语言

大数据与人工智能初了解

天翼云开发者社区

人工智能 大数据

大模型应用之基于Langchain的测试用例生成

京东科技开发者

让存储绿“翼”盎然,天翼云HBlock入选工信部目录!

天翼云开发者社区

云计算 存储 天翼云 中国电信

淘宝按关键字搜索API返回值应用指南:电商运营的得力助手

技术冰糖葫芦

API Explorer api 货币化 API 文档

为什么要制定流程规范?

老张

质量保障 checklist 流程规范

从数据到决策:拼多多商品详情API在市场分析中的应用

Noah

数字先锋| “药”上云!天翼云助力国药数科加速建设“国药云”

天翼云开发者社区

云计算 架构 云生态大会

青否数字人直播源码登场,直播平台必备功能齐全!

青否数字人

数字人

加密货币初创企业指南:如何寻找代币与市场的契合点

TechubNews

一文搞懂 Spring 循环依赖

江南一点雨

Java spring

Junit4遇上chatGPT

京东科技开发者

jenkins源代码管理+接入钉钉api发送接口自动化测试报告

测吧(北京)科技有限公司

测试

云主机(操作系统:CentOS7版本)安装nfs客户端,挂载文件系统

天翼云开发者社区

云计算 操作系统 云主机

更懂外贸老板的智能客服,XTransfer上线智能小秋2.0

XTransfer技术

AI 智能客服

云行| 龙云展翼 智绘未来,天翼云助力黑龙江打造数智产业新高地!

天翼云开发者社区

人工智能 云计算

大模型在推荐系统中的精准推荐策略与实践

京东科技开发者

文献解读-肿瘤测序-第六期|《基于CRISPR/Cas9技术的肿瘤突变负荷测量新参考物质的开发》

INSVAST

基因数据分析 生信服务 肿瘤测序

加密货币和区块链技术的支柱

区块链开发团队DappNetWork

大语言模型席卷大厂,为什么百度能先人一步?_AI&大模型_郑思宇_InfoQ精选文章