写点什么

深信服一朵云面向 AI 升级,不止承载 DeepSeek,更支持深度 AI 应用创新

  • 2025-02-17
    北京
  • 本文字数:1829 字

    阅读完需:约 6 分钟

大小:962.02K时长:05:28
深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新

近日,深信服一朵云面向 AI 进行全新升级:为用户打造更匹配大模型场景的智算承载、应用构建的 AI 平台,面向用户基于 DeepSeek 承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案。

 

总的来说,升级包含三个方面:


  • 线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括 DeepSeek 在内的最新大模型。

  • 线上托管云上线全新 AI 服务目录,提供 DeepSeek 等企业级大模型服务,用户可通过订阅来快速获取 AI 能力。

  • 全新发布 AI 应用创新平台,助力用户快速构建大模型应用,让 AI 应用的开发和运营变得更简单。

 

向 AI 升级后,深信服全面优化推理性能,让跑在一朵云上的大模型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。

 

相比基于个人开发者常用的 Ollama 方案部署 DeepSeek,深信服通过 AICP 算力平台的部署方案在多实例、并发推理场景中可实现 5-10 倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级 AI 应用构建及实际使用时,资源投入更低、体验更优。

 

通过一个问答测试场景演示,可以直观地感受效果:深信服(左侧)提供的推理速度更快,用户体验更好。


4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试


以 32B 模型为例,日常问答场景(2k 上下文),AICP 并发是 Ollama 的 8~10 倍,总吞吐 10 倍以上。


硬件资源:INT4用2*4090,FP16用4*4090


 知识库应用场景(4k 上下文),AICP 并发是 Ollama 的 2 倍,总吞吐 4~8 倍


硬件资源:INT4用2*4090,FP16用4*4090


具体而言,深信服可为用户提供:

 

1、HCI+AICP 算力平台:新一代超融合方案,更适合部署 DeepSeek 等企业级大模型

 

深信服现已打造「HCI+AICP 新一代超融合」解决方案,只需在原集群基础上增加一台 GPU 节点,就能基于本地集群快速部署并承载 DeepSeek 在内的企业级大模型。

 

无需重构原有基础框架,通过「新一代超融合」升级,基础设施即可完成从传统承载平台向智算承载平台的演进。所有承载通算、智算的集群资源都可以在信服云管理平台 SCP 上进行统一纳管。同时,平台支持大模型和小模型混合部署,实现资源的自动化调度,更大程度优化算力资源的利用率。

 

除了推理性能优化、部署与管理便捷,深信服 AICP 算力平台还提供了向导化的配置,实现一键训练,帮助用户开发垂直领域大模型,大幅降低研发门槛和成本。结合模型加密技术,有效保护用户知识产权,防止“模型资产”泄露。

 

同时,除了支持英伟达 GPU,深信服 AICP 算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。

 

2、线上服务目录向 AI 升级,快速订阅 DeepSeek 等大模型资源与服务

 

这次一朵云面向 AI 升级,深信服对线上服务目录也做了相应的扩展。

 

深信服托管云已支持基于专属资源+AICP 的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。

 

未来,深信服会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取 AI 能力,如 DeepSeek 等模型服务。

 

3、AI 应用创新平台全新发布,让大模型应用构建更简单

 

随着开源模型的不断发展,大模型承载愈发成为基础需求,各行业用户也正进一步关注如何快速构建应用并在实际业务中发挥价值。对此,深信服全新推出 AI 应用创新平台,助力用户更简单地完成 AI 应用的开发和运营。



1)、更简单的应用构建


深信服 AI 应用创新平台内置 RAG 最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的 RAG 应用(如智能客服、知识问答系统等)。

 

在生成阶段,用户可自主选择切换主流模型,比如使用基于深信服一朵云的方案线上或线下部署 DeepSeek 模型服务。这一功能相当于为用户打造了一个“懂业务知识”的专属 AI 应用——既深度结合企业内部知识沉淀,又无缝调用 DeepSeek 等先进模型能力,实现从数据到业务场景的精准匹配。

 

2)、更低门槛的数据调优


深信服 AI 应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。

 

3)、更高效的数据运营


应用发布后,平台通过 AI 智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过运营→评估→调优的闭环,实现 AI 应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。

 

通过这一平台,AI 应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖 AI 技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘 AI 在业务场景中的潜力。


接下来,深信服将为用户解锁围绕 DeepSeek 场景的最佳实践、应用构建方法及一朵云承载方案。

2025-02-17 17:535

评论

发布
暂无评论
发现更多内容

IT人的笔记本——全面了解 Jupyter

dongge

jupyterlab

在线YAML转Properties工具

入门小站

工具

MySQL 是如何实现RC事务隔离级别的

华为云开发者联盟

MySQL ReadView 事务隔离 RC事务隔离 Read Committed

架构实战营:模块七作业

Geek_93ffb0

「架构实战营」

【连接平台」企业告警信息通过机器人同步至钉钉群

钉钉开发者

连接器 钉钉应用开发 钉群

FinClip 与 uniapp:轻应用平台与前端开发框架

王字 Wannz

小程序 uniapp 移动开发 finclip

FinClip 的 2021 与 2022

王字 Wannz

finclip 小程序容器 小程序开发 小程序管理平台

我与音视频的故事 | 社区征文

Changing Lin

音视频

OpenHarmony移植案例:如何适配服务启动引导部件bootstrap_lite

华为云开发者联盟

开发板 OpenHarmony startup子系统 bootstrap_lite

利用鸿蒙JavaUI 框架的 WebView 加载本地冰墩墩网页

宇宙之一粟

鸿蒙开发 2月月更

2022年低代码的变化与趋势

BeeWorks

大模型应用新范式:统一特征表示优化(UFO)

百度开发者中心

圆桌会议:如何避免踩到移动研发中,效能提升那些坑

王字 Wannz

移动开发 迭代

FinClip 与 mPaaS:轻应用平台与移动应用开发平台

王字 Wannz

小程序 移动开发 mPaaS finclip 小程序容器

2021盘点 | 云主机年度榜单出炉,Top5花落谁家?

博睿数据

远程办公团队如何沟通?

王字 Wannz

远程办公 wrh 居家办公 线下办公 soho

小程序框架与平台编译对比

王字 Wannz

小程序 百度智能小程序 头条小程序 finclip 小程序框架

OCR技术用于在线身份认证的运营效果分析

OCR

Linux之at命令

入门小站

Linux

Camtasia卡点相册视频教程

淋雨

Camtasia 录屏软件

低代码OR零代码,企业如何选择自身所需的软件开发平台?

BeeWorks

分布式进阶(二十三):Nginx 服务器应用详解

No Silver Bullet

nginx https 正向代理与反向代理 SSL证书 2月月更

恒源云(GPUSHARE)_替代MLM的预训练任务,真的超简单吗?

恒源云

人工智能 自然语言处理 深度学习

有奖调查| 2022 Apache Pulsar 怎么过,你们说了算

Apache Pulsar

开源 云原生 中间件 Apache Pulsar Apache Pulsar 社区

【网络安全】一款针对Flutter的逆向工程分析工具

H

网络安全 逆向分析

各项结果排名第一!百度内容技术架构团队在国际向量检索大赛BigANN中斩获佳绩

百度Geek说

百度 内容 前端 后端

延迟任务场景,该如何提高吞吐量和时效性

华为云开发者联盟

redis 延迟任务 低延迟 Redis 消费队列

阿里云EMAS 1月产品动态

移动研发平台EMAS

阿里云 程序人生 移动开发 #EMAS

Java如何实现消费数据隔离?

CRMEB

手把手教你使用HarmonyOS本地模拟器

HarmonyOS开发者

HarmonyOS DevEco Studio

开源商业模式促进金融业科技生态的发展

王字 Wannz

小程序 开源 IT 金融

深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新_云计算_深信服_InfoQ精选文章