本期,我们探讨 DeepSeek 和其他大模型相比,到底处于什么水平?它为什么突然火了起来?它的落地应用前景和挑战又是什么?最后,我想和大家探讨一下中美在大模型领域的竞争。
亮点内容:
- DeepSeek 持续爆火,背后到底是什么原因;
- DeepSeek 基础模型核心架构 DeepSeekMoE
- DeepSeekR1 推理模型关键技术突破与原理解析
- DeepSeek 有什么应用场景和案例。
- 中美大模型未来竞争格局分析
嘉宾简介:
彭靖田,谷歌出海创业加速器导师,加州大学访问学者。
- 连续创业者:才云科技 AI 技术合伙人(20 年字节全资收购) ,品览联合创始人兼 CTO(23 年股权退出),上海载极数据创始人(24 年)提供大模型解决方案与咨询服务。
- 开源贡献者:Kubeflow/ TensorFlow/ Kubernetes。
- 行业布道者:Linux CNCF 程序委员会成员,大模型开发 / 微调训练和深度学习课程学员 10 万 +。
评论 (1 条评论)