QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

深信服一朵云面向 AI 升级,不止承载 DeepSeek,更支持深度 AI 应用创新

  • 2025-02-17
    北京
  • 本文字数:1829 字

    阅读完需:约 6 分钟

大小:962.02K时长:05:28
深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新

近日,深信服一朵云面向 AI 进行全新升级:为用户打造更匹配大模型场景的智算承载、应用构建的 AI 平台,面向用户基于 DeepSeek 承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案。

 

总的来说,升级包含三个方面:


  • 线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括 DeepSeek 在内的最新大模型。

  • 线上托管云上线全新 AI 服务目录,提供 DeepSeek 等企业级大模型服务,用户可通过订阅来快速获取 AI 能力。

  • 全新发布 AI 应用创新平台,助力用户快速构建大模型应用,让 AI 应用的开发和运营变得更简单。

 

向 AI 升级后,深信服全面优化推理性能,让跑在一朵云上的大模型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。

 

相比基于个人开发者常用的 Ollama 方案部署 DeepSeek,深信服通过 AICP 算力平台的部署方案在多实例、并发推理场景中可实现 5-10 倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级 AI 应用构建及实际使用时,资源投入更低、体验更优。

 

通过一个问答测试场景演示,可以直观地感受效果:深信服(左侧)提供的推理速度更快,用户体验更好。


4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试


以 32B 模型为例,日常问答场景(2k 上下文),AICP 并发是 Ollama 的 8~10 倍,总吞吐 10 倍以上。


硬件资源:INT4用2*4090,FP16用4*4090


 知识库应用场景(4k 上下文),AICP 并发是 Ollama 的 2 倍,总吞吐 4~8 倍


硬件资源:INT4用2*4090,FP16用4*4090


具体而言,深信服可为用户提供:

 

1、HCI+AICP 算力平台:新一代超融合方案,更适合部署 DeepSeek 等企业级大模型

 

深信服现已打造「HCI+AICP 新一代超融合」解决方案,只需在原集群基础上增加一台 GPU 节点,就能基于本地集群快速部署并承载 DeepSeek 在内的企业级大模型。

 

无需重构原有基础框架,通过「新一代超融合」升级,基础设施即可完成从传统承载平台向智算承载平台的演进。所有承载通算、智算的集群资源都可以在信服云管理平台 SCP 上进行统一纳管。同时,平台支持大模型和小模型混合部署,实现资源的自动化调度,更大程度优化算力资源的利用率。

 

除了推理性能优化、部署与管理便捷,深信服 AICP 算力平台还提供了向导化的配置,实现一键训练,帮助用户开发垂直领域大模型,大幅降低研发门槛和成本。结合模型加密技术,有效保护用户知识产权,防止“模型资产”泄露。

 

同时,除了支持英伟达 GPU,深信服 AICP 算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。

 

2、线上服务目录向 AI 升级,快速订阅 DeepSeek 等大模型资源与服务

 

这次一朵云面向 AI 升级,深信服对线上服务目录也做了相应的扩展。

 

深信服托管云已支持基于专属资源+AICP 的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。

 

未来,深信服会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取 AI 能力,如 DeepSeek 等模型服务。

 

3、AI 应用创新平台全新发布,让大模型应用构建更简单

 

随着开源模型的不断发展,大模型承载愈发成为基础需求,各行业用户也正进一步关注如何快速构建应用并在实际业务中发挥价值。对此,深信服全新推出 AI 应用创新平台,助力用户更简单地完成 AI 应用的开发和运营。



1)、更简单的应用构建


深信服 AI 应用创新平台内置 RAG 最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的 RAG 应用(如智能客服、知识问答系统等)。

 

在生成阶段,用户可自主选择切换主流模型,比如使用基于深信服一朵云的方案线上或线下部署 DeepSeek 模型服务。这一功能相当于为用户打造了一个“懂业务知识”的专属 AI 应用——既深度结合企业内部知识沉淀,又无缝调用 DeepSeek 等先进模型能力,实现从数据到业务场景的精准匹配。

 

2)、更低门槛的数据调优


深信服 AI 应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。

 

3)、更高效的数据运营


应用发布后,平台通过 AI 智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过运营→评估→调优的闭环,实现 AI 应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。

 

通过这一平台,AI 应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖 AI 技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘 AI 在业务场景中的潜力。


接下来,深信服将为用户解锁围绕 DeepSeek 场景的最佳实践、应用构建方法及一朵云承载方案。

2025-02-17 17:537800

评论

发布
暂无评论

头像类NFT的未来,实际价值在哪里?

博文视点Broadview

创元集团的数智化实践 这次选择了和火山引擎VeDI搭档

字节跳动数据平台

大数据 数据治理 12 月 PK 榜

前端培训机构学习前端开发难度大吗

小谷哥

线上线下大数据培训机构应该怎么选

小谷哥

【JVM实战系列】「监控调优体系」实战开发arthas-spring-boot-starter监控你的微服务是否健康!

码界西柚

Java JVM Alibaba Arthas 12 月 PK 榜

大道至简,自治为王 | 2022年12月《中国数据库行业分析报告》精彩抢先看

墨天轮

数据库 Serverless 云数据库 国产数据库 polarDB

学习大数据技术后的就业前景怎么样

小谷哥

启科 QuSaaS 真随机数解决方案与 Amazon Braket 结合实践

亚马逊云科技 (Amazon Web Services)

亚马逊云科技 Hero 专栏

四大领先优势加持,华为云会议服务更省心可靠!

路过的憨憨

TypeScript 前端工程最佳实践

京东科技开发者

typescript 前端 前端开发 编程语言】

这个团队敢闯、会创,北京交通大学团队结合昇思MindSpore技术助力打造“智慧安全交通”

极客天地

技术分享 | 测试的本质是什么?

霍格沃兹测试开发学社

探索科创服务升级之路,星创科服“贴身陪伴”硬科技冠军企业成长

硬科技星球

什么是数据管理?看完这篇你一定有收获

雨果

数据管理

图算法、图数据库在风控场景的应用

NebulaGraph

图数据库 风控

RabbitMQ、RocketMQ、Kafka延迟队列实现

艾小仙

Java kafka RocketMQ RabbitMQ 延迟队列

云上安全办公,就用华为云桌面

科技说

远程灵活办公,就用华为云桌面

科技说

【kafka运维】Leader重新选举运维脚本

石臻臻的杂货铺

kafka 运维

教你用JavaScript实现大转盘

小院里的霍大侠

JavaScript 初学者 入门实战

阿里云助力抖音,为2022世界杯护航

云布道师

阿里云

schema设计与管理

刺猬

数据人PK也无人,为什么业务部门的数据需求都是急活?

雨果

数据开发 数据工程师 数据服务

【基础知识】PCB板上的字母数字是什么意思,代表哪些元器件?

华秋PCB

元器件 PCB PCB设计

企业大数据价值最大化的关键因素

元年技术洞察

大数据 数据中台 数字化转型

数据中台选型前必读(七):解读数据服务的四大关键技术

雨果

数据中台 DaaS数据即服务

女生参加前端培训学习有前途吗?

小谷哥

武汉java培训后可以选择那些就业方向

小谷哥

校招面试真题 | 你的期望薪资是多少?为什么?

霍格沃兹测试开发学社

百度工程师带你体验引擎中的nodejs

百度Geek说

JavaScript 前端 nodejs 12 月 PK 榜

带你读AI论文丨针对文字识别的多模态半监督方法

华为云开发者联盟

人工智能 华为云 文字识别 12 月 PK 榜

深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新_云计算_深信服_InfoQ精选文章