内容介绍

本期,我们探讨 DeepSeek 和其他大模型相比,到底处于什么水平?它为什么突然火了起来?它的落地应用前景和挑战又是什么?最后,我想和大家探讨一下中美在大模型领域的竞争。

亮点内容:

  • DeepSeek 持续爆火,背后到底是什么原因;
  • DeepSeek 基础模型核心架构 DeepSeekMoE
  • DeepSeekR1 推理模型关键技术突破与原理解析
  • DeepSeek 有什么应用场景和案例。
  • 中美大模型未来竞争格局分析

嘉宾简介:
彭靖田,谷歌出海创业加速器导师,加州大学访问学者。

  • 连续创业者:才云科技 AI 技术合伙人(20 年字节全资收购) ,品览联合创始人兼 CTO(23 年股权退出),上海载极数据创始人(24 年)提供大模型解决方案与咨询服务。
  • 开源贡献者:Kubeflow/ TensorFlow/ Kubernetes。
  • 行业布道者:Linux CNCF 程序委员会成员,大模型开发 / 微调训练和深度学习课程学员 10 万 +。

评论 (1 条评论)

发布
用户头像
讲的好,声音还有磁性...
2025-02-17 15:57 · 北京
回复
没有更多评论了