
2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。
阶跃星辰 Tech Fellow 段楠已确认出席并发表题为《Step-Video 开源模型:视频生成基础模型的最新进展、挑战与未来展望》的主题分享,本演讲将围绕 Step-Video 系列开源模型,介绍视频生成基础模型的最新进展,包括文生视频和图生视频等任务。此外,本报告还将总结现有视频生成模型面临的主要挑战,并和大家讨论未来可能的发展发向。
段楠博士现任阶跃星辰 Tech Fellow ,带领研究团队构建以语言和视频为中心的多模态基础模型。此前,他曾任微软亚洲研究院资深首席研究员、自然语言计算团队研究经理( 2012 年至 2024 年)。段博士是中国科学技术大学和西安交通大学兼职博导,天津大学兼职教授。主要从事自然语言处理、代码智能、多模态基础模型、智能体等研究。他在本次会议的详细演讲内容如下:
演讲提纲
1. 视频生成背景和现状
视频生成从简单的帧插值逐渐演变为复杂的多模态生成任务
多模态融合(文本、图像、音频等)、大规模预训练模型的应用逐渐成为趋势
2. 视频生成 SoTA 模型:Step-Video
技术亮点
实验结果:性能对比、案例分析
视频生成目前面临的挑战
3. 关于未来的讨论
更强大的多模态融合
实时生成
您认为,这样的技术在实践过程中有哪些痛点?
高质量数据的获取、训练和推理效率、物理规律的遵循
演讲亮点
SoTA 模型的技术创新与架构优势
系统优化与高效训练
听众收益
了解该领域最新进展
除此之外,本次大会还策划了多模态大模型及应用、AI 驱动的工程生产力、面向 AI 的研发基础设施、不被 AI 取代的工程师、大模型赋能 AIOps、云成本优化、Lakehouse 架构演进、越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。
现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。

评论