写点什么

金山云升级全栈云计算体系,全方位承接大模型应用

  • 2024-02-01
    北京
  • 本文字数:2469 字

    阅读完需:约 8 分钟

大小:1.25M时长:07:18
金山云升级全栈云计算体系,全方位承接大模型应用

随着云原生、AIGC、大模型等新兴技术的迅速发展,智能化时代开启。云计算也正全面步入 3.0 时代,即云计算和人工智能深度融合的阶段。在这个阶段,人工智能技术成为云计算进一步释放潜力的核心推动力。

 

近日,金山云举办了「云+人工智能·时代新机遇」媒体沟通会,金山云副总裁钱一峰、金山云公有云产品中心负责人孙晓、金山云人工智能与大数据产品中心负责人徐寅斐在会上分享了金山云在基础能力、平台能力和模型服务等方面的技术历程和落地实践。通过技术自研和升级,金山云已初步建成人工智能时代民用领域全栈的云计算体系。

 

夯实基础,全面升级人工智能服务能力

 

全球数字化浪潮风起云涌,云计算作为数字经济重要的支撑基础,正发挥越来越重要的作用。其中,智能化作为云计算 3.0 时代的重要理念,已成为数字基础设施升级的重要驱动力。知名调研机构 IDC 于 2023 年发布的报告显示,未来 5 年,以大模型、生成式人工智能驱动的下一代人工智能有望带动整体云产业穿过下行阶段,重回高增长时代。

 

顺应趋势,金山云深入探索前沿技术,围绕 AIGC 升级核心计算、存储、网络等产品,从多个维度全面拥抱人工智能。

 

金山云副总裁钱一峰强调,在此次技术升级中,在网络上采用了目前业界流行的高性能 RoCE 网络。在成本方面,同样的集群如果采用 IB 网络,网络本身的成本几乎占整个算力群的一半,如果用 RoCE 网络,只占 5%到 10%,所以国内很多大厂都在往 RoCE 网络转,金山也是如此。

 

在计算方面,金山云第七代云服务器 X7 搭载第四代英特尔®至强®可扩展处理器、支持英特尔® AMX 原生加速能力,CPU 性能较上代最高提升 60%,内存升级至 DDR5,频率较上一代性能提升 50%。融合金山云自主创新的加速技术,云服务器 X7 可有效提升模型推理性能。

 

根据数据从极热到极冷的不同热度,金山云对象存储已覆盖标准存储、低频存储、深度低频存储、归档存储、深度冷归档存储和全闪存储等不同访问热度的存储产品。其中,金山云对象存储 KS3 极速型最高可提供 1Tbps/PB 的兑付带宽,相较基于机械硬盘(HDD)的对象存储性能提升了上百倍,能为 AIGC、存算分离和高性能计算等场景提供强有力的存储解决方案。

 

在底层技术基础上,金山云此次升级还新增了金山轻舟智问以及一些合作的商业模型。

 

一直以来,业内有一种观点认为一个大模型就解决所有问题,因为所有人都可以去调用大模型的 API,但根据用户的反馈和场景需求来看,把所有问题都扔给一个大模型去解决是非常昂贵的,更经济的做法是将不同的场景用不同规模的模型去解决。将这些平台打包在一起,可以为客户提供一个综合性价比最高的解决方案。

 

过去这一年,金山云一直在做两件事——夯实基础和做长长板。在云计算方上重点打磨四大基础能力:速度快、性能好、成本低、稳定易用;而做长长板找增量则体现在金山云在混合云、分布式云上的很多创新。

 

具体而言,在在公有云的核心产品上第一要做到一切皆标准,提升用云效率。第二,要做到软硬结合,最大限度提升客户用云性价比。

 

在混合云方面,客户拥有专属区或者专属集群,这既让客户拥有了云下的独立,又能让其享受云上的规模红利和弹性。

 

此外,在 Serverless 化上也有了新进展。Serverless 化过去是局限在算力层面,但随着存算分离场景的流行已经渗透到 PaaS 层面,如今 MySQL 也已经做到了 Serverless 化,另外也引入了开源向量数据库。

 

面向大模型应用场景,金山云推出互信虚拟私有网络(简称“互信 VPC”),解决模型厂商和应用厂商互信的问题。相对于标准 VPC,互信 VPC 对进出 VPC 的通信行为有着更为严格的控制,帮助客户解决合规和互信问题。针对 HTTP、HTTPS 等应用层负载场景,公司推出应用型负载均衡 ALB(Application Load Balancer),单实例最大支持 100 万 QPS。与云原生场景融合,客户在使用金山云容器服务 KCE 产品或自建 K8S 集群时,ALB 都可作为 Ingress 部署,为业务提供网络流量调度服务。

勇立潮头,做大模型助力者

2023 年被称为大模型“元年”。公开数据显示,从年初到年末,国内大模型数量超过 200 个。与“大模型”数量呈倍数级增长相反的是,真正被调用的大模型却相对较少。在本次大模型浪潮中,金山云坚持中立定位,充分发挥自身的底座和平台能力,做大模型的助力者。

 

在洞察到模型供需方的痛点后,金山云于去年 6 月率先推出 MaaS 互信推理专区方案(以下简称“MaaS 1.0”),在大模型厂商、用户和金山云之间建立互信,以解决模型及数据的互信问题。本次沟通会上,金山云发布 MaaS 互信推理专区方案 2.0(以下简称“MaaS 2.0”)。

 

在 MaaS 1.0 基础上,MaaS 互信推理专区方案 2.0 以金山云 IaaS 和 PaaS 为底座,可实现云上 LangChain 的一键部署,默认对接多个生态合作商业大模型和开源大模型。同时支持包括 BGE、Bert 等在内的 Embedding 模型,能无缝对接金山云全托管向量数据库 Milvus,提供面向企业开发者的简单易用、安全可信的一站式推理应用部署平台。此外,MaaS 2.0 支持通过标准化的 API 接口和 Web 前端界面,实现包括模型推理和知识库搭建的 RAG 大模型场景应用。为进一步增强云上运行的安全性,MaaS 2.0 还提供容器服务加密镜像解决方案,依托金山云裸金属服务,实现在金山云容器服务中从镜像加密、加密镜像上传、解密镜像运行的全流程模型安全运行。

 

同时,为满足行业客户的需求,金山云探索大模型时代企业赋能新机遇,围绕企业级知识助手场景制定了“一三一四”产品全景规划,即一套能力(金山云轻舟智问)、三个模型(行业语言模型、文本分片和 Embedding 模型)、一个平台(金山云瀚海平台)及四大功能(微调推理、数据加速、智能检索和文档智能),围绕生成式人工智能构建应用落地、模型训练微调、平台支撑的全栈能力。基于“一三一四”规划,金山云将分别针对应用型客户和平台型客户输出多项原子能力。目前,金山云轻舟智问知识助手产品已完成应用以及 Embedding 模型、多路召回算法和智能数据切片模型等核心技术的建设,计划优先在公共服务和法律场景落地。

 

与人工智能的结合,给了云更多的想象空间,也给各行业都带来了新的生产力。随着技术的进一步完善和落地,云计算将迎来更强更久的生命力。金山云将持续围绕客户需求“练内功”,携手生态伙伴以差异化打法布局未来。

2024-02-01 16:098465
用户头像
李冬梅 加V:busulishang4668

发布了 990 篇内容, 共 596.6 次阅读, 收获喜欢 1150 次。

关注

评论

发布
暂无评论
发现更多内容

如何查看崩溃日志

PostgreSQL数据库开发工具Navicat for PostgreSQL中文版

Rose

数据库设计 Navicat for PostgreSQL PostgreSQL数据库开发

2023年国内AI Agent下项目大盘点,科技大厂与创业公司齐头并进

王吉伟频道

创业 融资 大语言模型 AI Agent AI智能体

快麦ERP退货借助APPlink快速同步CRM

RestCloud

零代码 CRM ERP APPlink

草料荣获第五届中国工业互联网大赛新锐组二等奖

草料二维码

二维码 草料二维码

5分钟使用Hologres实时湖仓加速分析挑战赛来袭

阿里云大数据AI技术

软件开发

Geek_8da502

Mac电脑前端代码编辑神器:Sublime Text 4 Dev 激活码中文

mac大玩家j

代码编辑器 Mac软件 前端代码编辑器

TikTok海外直播专线:优化你的海外直播体验

Ogcloud

直播 直播优化 TikTok

OpenAI 也在 996?一位离职员工自白:代码贡献第四,经常工作 6 天丨 RTE 开发者日报 Vol.121

声网

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

编程猫

去年最火的 JS 开源项目「GitHub 热点速览」

EquatorCoco

GitHub 开源 js 工具库

程序员都必须知道的Vue 开发技巧

不在线第一只蜗牛

vue.js Vue 开发技巧

超自动化助力企业财务转型升级

智达方通

超自动化 企业财务转型

NFTScan | 01.01~01.07 NFT 市场热点汇总

NFT Research

NFT NFT\ NFTScan

Avdshare Audio Converter for Mac(性能超强的音频格式转换器)

Rose

苹果软件下载 Avdshare Audio Converter Mac音频格式转换器

2024年,苟住求活,才是长期主义

老张

第二曲线 职场发展 互联网裁员

做CAE分析用哪个显卡?CAE咨询

思茂信息

仿真 CAE CAE软件

AudFree Tidable Music Converter for Mac(Tidal音乐转换器)

Rose

Tidal音乐转换器 苹果电脑音频转换器 AudFree Tidal Music

macos强大的界面设计和原型制作工具:Kite

Rose

Mac动画原型设计 Kite for Mac破解 Kite Mac下载 苹果软件下载站

APP加固技术及其应用

雪奈椰子

实时获取建材网商品数据:API实现详解与代码示例

Noah

LED屏租赁需求激增,为何LED显示屏租赁如此受欢迎?

Dylan

综艺节目 应用 LED显示屏 户外LED显示屏 led显示屏厂家

万界星空科技云MES,助力客户快速构建数字工厂

万界星空科技

mes 万界星空科技 低代码云MES

矢量图形转换工具vector magic for Mac 兼容macos14系统

Rose

mac软件下载 Vector Magic破解版 矢量图像转换工具

MongoDB 数据库管理和开发Navicat for MongoDB【Mac/win】

Rose

MongoDB数据库 Navicat数据库下载 Navicat for MongoDB中文

[Mac/win数据库最新版]Navicat for MySQL 永久激活教程

Rose

Navicat for MySQL 数据库管理开发 Navicat数据库软件下载

F5:伴随生成式AI的发展,2024年将出现十大网络安全风险威胁

科技热闻

【年后跳槽必看篇-非广告】Spring Bean的生命周期

派大星

spring 跳槽季 Java 面试题

强大的原型设计:Kite Compositor最新激活版

胖墩儿不胖y

Mac软件 原型设计工具 Mac动画软件

金山云升级全栈云计算体系,全方位承接大模型应用_AI 工程化_李冬梅_InfoQ精选文章