QCon北京|3天沉浸式学习,跳出信息茧房。 了解详情
写点什么

北电数智实现 DeepSeek-V3/R1 全尺寸模型与国产芯片混元算力适配

北电数智

  • 2025-02-10
    北京
  • 本文字数:698 字

    阅读完需:约 2 分钟

大小:361.38K时长:02:03
北电数智实现DeepSeek-V3/R1全尺寸模型与国产芯片混元算力适配

日前,北电数智基于“宝塔·模型适配平台”,完成 DeepSeek V3/R1 全尺寸模型与海光 DCU、华为、壁仞科技、沐曦等国产芯片的混元算力适配,为开发者带来更多算力选择。用户可忽略底层硬件差异,平台基于用户调用需求自动匹配合适算力进行 DeepSeek 模型的推理。



DeepSeek 采用创新的混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)、自研训练框架等多项工程化创新,基于较少 GPU 训练机时实现了 R1 与 OpenAI o1‌相当、V3 与 OpenAI 4o 相当的模型性能,具有高推理效率和低训练成本的特点,彰显了坚持中国原创的价值。

 

DeepSeek 的算法创新对 AI 芯片通用性提出更高要求,国产芯片在底层架构、软件生态上各有不同,北电数智的高质量 AI 工具链“宝塔·模型适配平台”能抹平芯片架构的差异,快速实现对模型的优化支持和硬件适配。目前宝塔已完成 24 款基座大模型适配。

 

在处理推理任务层面,针对 DeepSeek 类超大模型,数据中心的集群化推理变得尤为重要,例如 PD 分离(Prefill-Decode 分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与 DeepSeek 技术路线具有天然匹配性,可进一步优化推理效果,加速推理速度,降低推理成本,解决算力不够用问题。

 

DeepSeek 的发展给行业带来了深刻启示,唯有促进、满足国产原生模型的算力需求才能真正推动国产算力发展。为全面挖掘芯片性能潜力与适配能力,北电数智推出“星火·国产算力 AI 原生适配认证”,加强国产模型与国产算力适配,推动国产算力芯片孵化 AI 原生应用。

 

北电数智已正式开通企业版内测,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力服务,助力用户在多芯混元算力上轻松构建和部署基于 DeepSeek 模型的 AI 应用。

2025-02-10 09:436082

评论

发布
暂无评论

2021最新分享字节四面成功拿Offer!

Java 程序员 后端

进击的Java(二)

ES_her0

11月日更

21世纪什么最贵?“人才”看阿里大佬用一本书带你读懂TCP-IP协议

Java 程序员 后端

数字原生,创新生长|企业如何打造数字创新的“飞天梦”?

阿里巴巴云原生

阿里云 产品 云原生 双十一

Redis 6.0 新特性篇:多线程网络模型全面解密

码哥字节

redis 多线程 IO多路复用 11月日更

Prometheus HTTP API 查询(四)Target 和查询结果格式

耳东@Erdong

Prometheus PromQL HTTP API 11月日更

2021阿里巴巴钻石级级“Docker全线笔记”新鲜出炉

Java 程序员 后端

22款终端生产力工具,效率飞起!

Java 程序员 后端

2021阿里大牛最新发布:Java高频面试题和核心技术(已涨薪6K)

Java 程序员 后端

分片技术:如何解决区块链的性能问题?

CECBC

OpenVINO基于Tensorflow的模型训练及优化部署

IT蜗壳-Tango

11月日更

2021最新分享成功入职腾讯(后台开发岗)面经

Java 程序员 后端

2021社招阿里、腾讯、蚂蚁金服「4面」Java面试高频题分享

Java 程序员 后端

System.Text.Json 中的字符编码

喵叔

11月日更

25 大 Java 后端面试指南,3000 道面试题解析

Java 程序员 后端

区块链之符号理论:抽象化和身份管理的必要条件

CECBC

架构训练营第 3 期模块三作业

吴霏

「架构实战营」

2021金三银四,献给程序员从入门到放弃的 Java 架构师面试题

Java 程序员 后端

2021最新出炉BAT架构实战文档:多线程与高并发+分布式+微服务

Java 程序员 后端

2021最新分享“天猫”面经:10万字大厂面试总结

Java 程序员 后端

为什么区块链和加密资产对于实现元宇宙很重要?

CECBC

2021最新分享成功入职阿里巴巴(口碑部门)面经

Java 程序员 后端

2021,你还在写“赤裸裸”的API吗?

Java 程序员 后端

22道Java Spring Boot高频面试题

Java 程序员 后端

2年Java,面试蚂蚁金服总结

Java 程序员 后端

2021年备战金三银四:死磕“源码”篇(Java程序员必看

Java 程序员 后端

2021总结全网最新、最全、最实用Java岗面试真题!已收录GitHub

Java 程序员 后端

解决:interface conversion: interface {} is float64, not int

liuzhen007

11月日更

2021春招Java后端开发面试总结:25个技术专题(最全面试攻略)

Java 程序员 后端

2021美团高级工程师亲自汇总九大面试专题(附1000字解析)

Java 程序员 后端

2021,你还在写“赤裸裸”的API吗?(1)

Java 程序员 后端

北电数智实现DeepSeek-V3/R1全尺寸模型与国产芯片混元算力适配_AI&大模型_InfoQ精选文章