写点什么

北电数智实现 DeepSeek-V3/R1 全尺寸模型与国产芯片混元算力适配

北电数智

  • 2025-02-10
    北京
  • 本文字数:698 字

    阅读完需:约 2 分钟

大小:361.38K时长:02:03
北电数智实现DeepSeek-V3/R1全尺寸模型与国产芯片混元算力适配

日前,北电数智基于“宝塔·模型适配平台”,完成 DeepSeek V3/R1 全尺寸模型与海光 DCU、华为、壁仞科技、沐曦等国产芯片的混元算力适配,为开发者带来更多算力选择。用户可忽略底层硬件差异,平台基于用户调用需求自动匹配合适算力进行 DeepSeek 模型的推理。



DeepSeek 采用创新的混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)、自研训练框架等多项工程化创新,基于较少 GPU 训练机时实现了 R1 与 OpenAI o1‌相当、V3 与 OpenAI 4o 相当的模型性能,具有高推理效率和低训练成本的特点,彰显了坚持中国原创的价值。

 

DeepSeek 的算法创新对 AI 芯片通用性提出更高要求,国产芯片在底层架构、软件生态上各有不同,北电数智的高质量 AI 工具链“宝塔·模型适配平台”能抹平芯片架构的差异,快速实现对模型的优化支持和硬件适配。目前宝塔已完成 24 款基座大模型适配。

 

在处理推理任务层面,针对 DeepSeek 类超大模型,数据中心的集群化推理变得尤为重要,例如 PD 分离(Prefill-Decode 分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与 DeepSeek 技术路线具有天然匹配性,可进一步优化推理效果,加速推理速度,降低推理成本,解决算力不够用问题。

 

DeepSeek 的发展给行业带来了深刻启示,唯有促进、满足国产原生模型的算力需求才能真正推动国产算力发展。为全面挖掘芯片性能潜力与适配能力,北电数智推出“星火·国产算力 AI 原生适配认证”,加强国产模型与国产算力适配,推动国产算力芯片孵化 AI 原生应用。

 

北电数智已正式开通企业版内测,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力服务,助力用户在多芯混元算力上轻松构建和部署基于 DeepSeek 模型的 AI 应用。

2025-02-10 09:436113

评论

发布
暂无评论

微信小程序:跨端开发框架的繁荣发展之路

没有用户名丶

通宵加班设计的储能板不能用?厚铜PCB设计这个问题一定要注意

华秋电子

储能

鸿蒙生态星河璀璨| 先行者李洋全力以赴,拥抱星辰大海

最新动态

SpringBoot3集成Kafka

Java kafka 架构 springboot SpringBoot3

直播系统源码协议探索篇(二):网络套接字协议WebSocket

山东布谷科技

软件开发 websocket 源码搭建 直播系统源码 网络套接字协议

WIFI7 M.2 moudle-QCN9274+QCN6274-Pinnacle of WiFi field-support-MU-MIMO-OFDMA-TWT technology

wifi6-yiyi

6G WiFi 7

ThreadLocal不过如此

java易二三

Java 程序员 计算机

OLED屏幕,LED,AMOLED哪个更好?

Dylan

LED 显示器 LED显示屏

【华秋推荐】无线充电的原理与解决方案

华秋电子

无线充电

Flink 数据集成服务在小红书的降本增效实践

Apache Flink

大数据 flink 实时计算

基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录

字节跳动数据平台

大数据 A/B测试 企业号 8 月 PK 榜

SimpleDateFormat 线程安全问题修复方案 | 京东物流技术团队

京东科技开发者

jdk8 线程安全 SimpleDateFormat类 SimpleDateFormat 企业号 8 月 PK 榜

这,就是大模型时代的生产力!

飞桨PaddlePaddle

人工智能 paddle 百度飞桨 文心大模型 WAVE SUMMIT

BSN“五、十、百”工程实施半年成果丰硕,助力数字化转型和高质量发展

BSN研习社

Eudic欧路词典 for Mac(英语学习工具) v4.4.5增强激活版

mac

苹果mac Windows软件 欧路词典 Eudic mac 英语学习工具

火山引擎DataLeap:助力PICO落地数据流程规范,提升开发效率

字节跳动数据平台

数据中台 数据治理 数据安全 数据研发 企业号 8 月 PK 榜

OpenTiny Vue 组件库实现主题配置和UX交互规范自定义

OpenTiny社区

开源 Vue 前端 组件库

React请求机制优化思路 | 京东云技术团队

京东科技开发者

React 前端性能 企业号 8 月 PK 榜 react18 请求机制

Vue 框架提升加载速度的经验分享

FinClip

Java如何生成随机数?要不要了解一下!

java易二三

Java 程序员 random 计算机

《知识图谱互联互通白皮书》正式发布,合合信息携手电子标准院共同推动技术规范化发展

合合技术团队

人工智能 知识图谱

一文带你读懂设计模式之责任链模式 | 京东云技术团队

京东科技开发者

源码分析 设计模式 责任链模式 企业号 8 月 PK 榜

奖金丰厚 等你来拿!第六届开源创新大赛飞桨赛道下半场来啦

飞桨PaddlePaddle

人工智能 百度飞桨

北电数智实现DeepSeek-V3/R1全尺寸模型与国产芯片混元算力适配_AI&大模型_InfoQ精选文章