QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

面壁智能 CTO 曾国洋确认出席 QCon 北京,分享迈向 AGI 的关键技术实践

  • 2025-03-24
    北京
  • 本文字数:973 字

    阅读完需:约 3 分钟

面壁智能CTO曾国洋确认出席QCon北京,分享迈向 AGI 的关键技术实践

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


面壁智能联合创始人 & CTO 曾国洋已确认出席并发表题为《端侧模型的知识密度:迈向 AGI 的关键技术实践》的主题分享。近几年大模型技术快速发展,取得了一系列重大突破,大模型能力的核心“知识密度”逐渐为大家所认知。面壁智能一直以来致力于研发更高知识密度的大模型,在业内首先提出知识密度概念并在模型研发过程中取得实践。本次分享内容将围绕大模型知识密度展开,介绍知识密度与大模型的关系以及知识密度长期发展方向,帮助大家更好的理解大模型技术在未来一段时间的发展趋势,提前布局保障企业的核心竞争力。


曾国洋于 2015 年 NOI 金牌进入清华大学计算机系,曾获清华大学挑战杯一等奖、首都大学生挑战杯一等奖、智能体大赛一等奖等。2017 年加入清华大学自然语言处理实验室,2020 年以骨干身份加入「悟道·文源」中文预训练大模型团队,参与 CPM 系列模型的训练和研发,在此期间编写了大模型高效训练和推理工具 BMTrain、BMInf 等,并获多项发明专利。自 2021 年起担任智源研究院语言大模型加速技术创新中心副主任,并于 2022 年创立面壁智能并担任 CTO,入选 2024 年度“北京市科技新星计划”,致力于推动大模型技术的落地应用。他在本次会议的详细演讲内容如下:


演讲提纲

1. 大模型技术趋势

  • 从 GPT-3 到 Deepseek-R1 大模型技术演变历程

  • 下一次 Deepseek 时刻会发生在哪

  • 预训练终结后的大模型前景

2. 知识密度的现状与挑战

  • 知识密度的定义与模型发展规律

  • 知识密度与模型能力上限的关系

  • 突破知识密度的技术实践

3. 思维链与强化学习

  • 大模型为什么需要思维链

  • 强化学习与思维链技术结合对大模型的意义

4. 大模型应用落地展望

  • 未来大模型格局如何演变

  • 知识密度之外,大模型应用落地还存在哪些障碍

  • 大模型快速发展时代,如何不落后于潮流



本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。



2025-03-24 15:474778

评论

发布
暂无评论

3D地图与3D柱状图联合使用

ThingJS数字孪生引擎

大前端 地图 可视化 数字孪生

兰宝环保 | 新体系“行动计划”中化工制药行业VOCs废气治理要点

叶落便知秋

WorkPlus高端制造业数字化解决方案—科达洁能

BeeWorks

开源 企业 解决方案 即时通讯

瞥一瞥AI,撩一撩算法

博文视点Broadview

Erda 1.1 版本发布|3 大亮点特性最新解读

尔达Erda

开源 云原生 k8s PaaS SaaS

第三届WICC北京落幕 展现开发者服务生态与建设新方向

融云 RongCloud

TensorFlow Recommenders: Quickstart

毛显新

深度学习 tensorflow 推荐系统 keras

INFRA-JOY微服务治理验证工程实践分享

徐敏

微服务 自动化测试 全链路压测 性能压测

坐下来谈谈如何写好一份简历?

童欧巴

面试 大前端 简历

CloudQuery 首次开放API,v1.4.1将开放「部门导入」和「用户导入」

BinTools图尔兹

数据库 OpenAPI 数据库管控

大数据实战训练营Hbase作业

Clarke

手把手体验远程开发,确实爽

程序员鱼皮

Java Python 软件 大前端 后端

Java集合源码总结分析

剖根问底:Java 不能实现真正泛型的原因是什么?

沉默王二

java

WorkPlus高端制造业数字化解决方案—首发集团

BeeWorks

开源 企业 即时通讯 移动开发

带你走进“华为链”

华为云开发者联盟

区块链 高性能 华为链 自研区块链平台 自主可控

云图说 | 华为云医疗智能体,智联大健康,AI药物研发

华为云开发者联盟

AI 药物研发 医疗智能体

AI论文解读丨融合视觉、语义、关系多模态信息的文档版面分析架构VSR

华为云开发者联盟

语义 视觉 多模态信息 文档版式 VSR

中易通科技禾禾实验室产品培育田

叶落便知秋

泰国Ascend Money用开源软件加快应用交付

BeeWorks

阅读

以两种异步模型应用案例,深度解析Future接口

华为云开发者联盟

Java 模型 异步 FutureTask Future接口

详解Camtasia的PPT录制功能

淋雨

视频剪辑 Camtasia 录屏软件

Java程序员必备框架—Spring全家桶的前世今生详细梳理

北游学Java

Java spring

模块三

Winston

男人要慢,SQL要快:记一次慢SQL优化

艾小仙

区块链去中心化钱包开发|开发去中心化钱包

Geek_23f0c3

钱包系统开发 去中心化交易所系统开发 去中心化钱包 去中心化交易所

大厂面试真题——Netty/IO篇,你能答上来几道?

Java架构师迁哥

如何在二三线城市月薪过万(一)看完这篇后端简历优化,包你面试不断

小鲍侃java

面试 后端

数据对AI的重要性:采访首席数据官Rick McFarland - LexisNexis Legal & Professional

BeeWorks

阅读

小白必看,通俗易懂的LockSupport

程序猿阿星

Java并发 线程协作 LockSupport 线程间通信

Using side features: feature preprocessing

毛显新

自然语言处理 深度学习 tensorflow 推荐系统 keras

面壁智能CTO曾国洋确认出席QCon北京,分享迈向 AGI 的关键技术实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章