速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

华为盘古大模型 3.0 发布:不开源,现阶段谈投入和收益为时尚早

  • 2023-07-10
    北京
  • 本文字数:1278 字

    阅读完需:约 4 分钟

华为盘古大模型3.0发布:不开源,现阶段谈投入和收益为时尚早

2023 年 7 日-9 日,华为开发者大会2023(Cloud)期间,华为发布盘古大模型 3.0。华为盘古大模型最早在2021年发布,发展到今天,盘古大模型已经在金融、制造、医药研发、煤矿、铁路等诸多行业发挥作用。


华为云 CTO 张宇昕在接受 InfoQ 采访时表示,华为盘古大模型全栈技术均由华为自主创新,从算力到基础的算子、基础的框架到盘古的开发平台以及模型均没有采用任何开源技术。另外,由于华为云盘古大模型的定位是“AI  for  Industries”,这些行业大模型里沉淀了客户的知识经验,所以华为不会、也不可能把客户的资产开放出来,也就是说盘古大模型不会开源,而是走商业闭源的道路。


据华为常务董事、华为云 CEO 张平安介绍,盘古大模型 3.0 是面向行业的大模型系列,包括“5+N+X”三层架构:L0 层是 5 个基础大模型,包括自然语言、视觉、多模态、预测、科学计算,提供满足行业场景中的多种技能需求。


盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。


L1 层是 N 个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自己的专有大模型。


L2 层是为客户提供 X 个细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。


盘古大模型采用完全的分层解耦设计,一方面是为了快速适配、快速满足行业的多变需求,背后更是华为希望借此构筑出良好的商业模式的考虑。


在解耦的三层设计之上,客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,可以单独升级能力集。在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。


张平安强调,盘古大模型的路标图价值将更注重于行业应用的深化和扩展。团队已经在铁路、煤矿、金融和政府等行业开展了大模型的应用,并且还有许多行业需要大模型的支持。未来,团队将加快行业大模型的开发速度,并且在行业垂直领域深化应用。


算力是训练大模型的基础。本次大会上,张平安还宣布单集群 2000P Flops 算力的昇腾AI云服务在华为云的乌兰察布和贵安 AI 算力中心同时上线。昇腾 AI 云服务除了支持华为全场景 AI 框架昇思 MindSpore 外,还支持 Pytorch、Tensorflow 等主流 AI 框架。


毫无疑问,大模型的投入是巨大的。不过张平安亦坦言,现阶段讨论盘古大模型的成本与收益还为时尚早,华为在贵阳和乌兰察布投入了大量昇腾 AI 算力,并相信把昇腾 AI 算力做好之后,中国的许多行业以及重塑将会采用盘古大模型。

2023-07-10 07:007147
用户头像
罗燕珊 AI practitioner | Tech media

发布了 499 篇内容, 共 335.8 次阅读, 收获喜欢 798 次。

关注

评论

发布
暂无评论
发现更多内容

网络设备是什么?云管平台可以管理吗?

行云管家

云计算 云服务 网络设备

Analysis of WiFi 5 IPQ4019 and WiFi 6 IPQ6010 Mesh Technology and Performance

wifi6-yiyi

wifi mesh

获取淘宝商品详情API返回值的技术实现方案

代码忍者

API 接口 pinduoduo API

Solana Payment:下一波加密支付革命的崛起

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

Karmada新版本发布,支持联邦应用跨集群滚动升级

华为云开发者联盟

容器 Karmada Kubernetes Serverless 开源、 云原生‘’

融云携高潜市场出海攻略亮相「2024 拉美中东北非出海峰会」

融云 RongCloud

“AI+Security”系列第3期(七):智能体车企落地实践

云起无垠

参赛故事|大一的我感受到金蝶云苍穹技术的乐趣

金蝶云·苍穹

开发者大赛 金蝶 金蝶云苍穹 中国软件杯

尘埃落定 完满解决!英特尔官方对于13/14代酷睿台式机处理器调查结果出炉

E科讯

圆满解决!13/14代酷睿不稳定问题更新可解决,性能没影响

E科讯

掌握这几个打字小技巧,打字速度翻倍很容易

巧手打字通

办公效率 输入法 办公软件 打字练习 打字软件

利用 Page Visibility API 优化网页性能与用户体验

_知秋

JavaScript WebApi PageVisibility

怎么平衡研发效能度量和管理成本?

思码逸研发效能

效能洞察 效能 效能提升 效能工具 研发资源

ECCV 2024 | 融合跨模态先验与扩散模型,快手处理大模型让视频画面更清晰!

快手技术

音视频开发 大模型

淘宝买家秀API:打造商品口碑生态圈的关键

技术冰糖葫芦

API Gateway API 接口 API 测试 API 优先 pinduoduo API

极狐GitLab 新能源赛道客户案例分享之比博斯特

极狐GitLab

gitlab cicd 新能源

探索AI新境界!昇腾AI原生创新算子挑战赛(S2赛季)决赛顺利闭幕

Geek_2d6073

助推专利转化 发展新质生产力 第二届全国专利密集型产品展区开展

科技热闻

百万度算力,限时免费送送送送送!

九章云极DataCanvas

九章云极DataCanvas公司入选沙利文权威报告领先代表厂商

九章云极DataCanvas

HarmonyOS NEXT实战电话拨打

李洋-蛟龙腾飞

HarmonyOS NEXT

IPQ9574: Does Wallystech's DR9574 Powered by Qualcomm IPQ9574 Support MLO?

wallyslilly

qcn9274 ipq9574

智能设备领域掀起鸿蒙浪潮,科沃斯、TP-LINK、雅迪等率先完成智能设备或企业内部办公应用鸿蒙化

最新动态

CEX上币趋势分析:Infra赛道与Ton生态的未来

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 NFT开发 代币开发

高效算力网助推智算时代繁荣发展

Geek_2d6073

CRUD 开发工具 NocoBase 与 Refine 对比

NocoBase

开源 低代码 开发工具 crud 无代码

线上事故案例集:从分析到预防的全方位指南

巧手打字通

后端 事故 风险管理 事故复盘 安全研发

TDengine 建模实战:手把手教你高效设计数据结构

TDengine

数据库 tdengine 时序数据库

【YashanDB知识库】崖山数据库Outline功能验证

YashanDB

yashandb 崖山数据库 yashandb知识库

数据要素如何重塑企业价值?

郑州埃文科技

数据治理 数据要素

网络安全检测神器:实战案例解析高效端口扫描技术

幂简集成

网络安全 Python JSON 网络端口扫描

华为盘古大模型3.0发布:不开源,现阶段谈投入和收益为时尚早_华为_罗燕珊_InfoQ精选文章