
2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。
字节跳动数据平台资深大模型技术专家赵晓明已确认出席并发表题为《LLM 引领数据分析进化在字节数据平台的实践》的主题分享。2021 年 LLM 大语言模型爆发,字节跳动利用 LLM 技术构建垂直化数据智能引擎,实现从规则到意图、单一到全链路、“工具”到“智能助手”的跃迁。本次演讲主要分享其数据智能发展历史、LLM 技术突破带来业务演进、大数据领域模型建设以及对未来数据分析域产品形态的演进思考。
赵晓明曾服务过华为、阿里等公司,目前负责字节跳动-Data-数据平台 领域大模型相关技术工作。从早期基于 Bert NLP 技术孵化 Databot 机器人,到近 2 年结合 LLM 能力构建大数据领域模型,经历了近些年数据智能技术的演进,在数据智能领域有丰富的落地经验。他在本次会议的详细演讲内容如下:
演讲大纲
1. 背景:数据智能发展史
大模型数据分析产品形态,从「传统 BI」到「DI = AI+BI」
2. 数据智能相关技术发展史
早期:搜索式 BI
中期:基于 Bert NLP 交互式 Databot
近期:LLM 技术升级下的 DataAgent 机遇 &挑战
3. LLM 技术引领数据分析领域业务演进
端到端的数据分析全域升级
代码补全: 临时查询取数、数据加工任务
SQL 工具:日常 SQL 任务开发维护(联动修改、批量更新、Bugfixed )
Schema 建模:智能建模(字段增强、 表达式生成、数据集摘要)
DataAgent 智能体 :NL2SQL 分析取数、ADA 高级分析
4. 领域模型建设 & 落地效果
领域知识中心 : 资产沉淀、知识挖掘
知识嵌入: 数据资产召回(表、字段、 数据口径、白皮书等)
LLM 领域模型精调 : CT、SFT、RL
5. 总结与展望
技术侧:LLM 模型能力提升、多模态技术结合
产品侧:新交互孵化、产品能力持续迭代升级
您认为,这样的技术在实践过程中有哪些痛点?
在实践中,如何构建领域模型相对通用模型的优势,且需要衡量 ROI 投入产出比
演讲亮点
从 0 到 1 构建大数据领域模型,支持端到端的数据分析全域升级。不局限于智能分析取数场景,同时利用知识挖掘、生产的方式沉淀领域知识中心
听众收益
从传统 BI 到 DI(AI + BI) 的转变,掌握数据分析产品的未来趋势
了解 LLM 在引领数据分析进化的演进现状
掌握 LLM 在数据分析全域升级的技术架构
了解大数据领域模型的搭建过程
除此之外,本次大会还策划了多模态大模型及应用、AI 驱动的工程生产力、面向 AI 的研发基础设施、不被 AI 取代的工程师、大模型赋能 AIOps、云成本优化、Lakehouse 架构演进、越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。
现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。

为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088
评论