5 月 17 日,由极客邦旗下 InfoQ 中国倾力打造的 AICon 全球人工智能开发与应用大会暨大模型应用生态展在北京正式开幕,会场内人头攒动,盛况空前!演讲嘉宾阵容强大,既有行业领军人物分享战略远见,也有技术大咖深入剖析最新成果,到场的每一位观众都受益匪浅。
本次大会设置了丰富的 14 大议题板块,涵盖 AI Agent、RAG 检索生成技术、企业级生成式 AI 助手 Amazon Q、Copilot 辅助程序开发、大规模模型的训练与推理优化策略、基础设施搭建、LLMOps 实践、多模态大模型研究、大模型与行业创新应用融合、AI 最前沿的探索领域,以及针对大模型在全球范围内的机遇与 AI Agent、RAG 检索与生成、Copilot 应用构建、大模型训练以及推理优化、基础设施构建、LLMOps、多模态大模型、大模型 + 行业创新应用、AI 前沿探索以及大模型全球化机会和挑战等。
超过 60 位来自 Google、微软、字节、阿里、科大讯飞、智谱、亚马逊云科技、月之暗面、MiniMax、无问芯穹、Lepton AI、数势科技、北京智源人工智能研究院、腾讯等行业头部企业的嘉宾将齐聚一堂,在现场带来精彩纷呈的见解与分享。
除此之外,大会还特别策划了首届大模型应用生态展,邀请众多致力于 AI 和大模型行业落地应用探索,有实践、有创新、有成果的企业,将应用案例和创新产品搬到 AICon 现场,让现场参会者进深入了解并沉浸式体验生成式 AI 在未来的无数可能。
开幕精华:洞悉行业变迁
本次大会于今日上午 9 点正式开幕,极客邦科技 / 事业合伙人、InfoQ 极客传媒 & 极客时间企业版总经理汪丹(Yolanda)为大会致开幕辞。她首先阐述了这一年 InfoQ 围绕生成式 AI 和大模型技术发展所展开的内容工作和现有成果,接着介绍了今年 AICon 大会的所有看点,包括精彩议题和现场丰富的体验及试驾活动。现在大语言模型对不少业务来说已足够智能,而生成式 AI 的落地关键在于数据战略、大模型选择和实现方式。经过一年多的发展,中国生成式 AI 领域涌现出了不少优秀的企业和案例。
继 2020 年正式推出中国技术力量年度榜单品牌之后,今年 InfoQ 再次面向 AIGC 赛道推出【中国技术力量 2024 之 AIGC 先锋榜】。现场,汪丹正式揭晓了榜单结果。经过对来自互联网、金融、通信、制造、教育等众多领域的多轮优秀案例评选,30 家杰出企业脱颖而出。
其中,凭借各自的优秀创新实践案例上榜【AIGC 最佳实践案例 TOP20】的企业,包括快手、作业帮、网易数帆、阿里云函数计算团队、蚂蚁科技集团股份有限公司、顺丰科技、李白人工智能实验室、360 集团、上海笑聘网络科技有限公司、北京文因互联科技有限公司、中国人民人寿保险股份有限公司、北京衡石科技有限公司、吉利汽车集团、深圳前海百递网络有限公司、德邦证券股份有限公司、杭州卓印智能科技有限公司、杭州座头鲸科技有限公司、上海蜜度科技股份有限公司、中国联合网络通信有限公司上海市分公司、深智透医疗科技发展(上海)有限责任公司。
而在进行技术攻坚性、方案成熟度、标杆客户案例、客户服务能力等多维度的评分后,数势科技、网易 CodeWave、北京白海科技有限公司、北京潞晨科技有限公司、硅基流动、容联云、优刻得科技股份有限公司、智子引擎、南京柯基数据科技有限公司、江苏汇智智能数字科技有限公司上榜【AIGC 最佳技术服务商 TOP10】。
随后,InfoQ 研究总监兼首席分析师姜昕蔚正式发布《中国 AGI 市场发展研究报告 2024》,并对报告进行了详细解读。
报告指出,目前各行业数字基础不同,应用场景需求急迫性不同,因此 AGI 在各行业应用程度也不同。InfoQ 研究中心根据探索时间、应用成果、用户反馈等内容,并结合专家访谈,将 AGI 在各行业的应用生命周期划分为四个阶段:应用探索期、产品测试期、市场投放期和应用成熟期。
整体来看,营销、零售、金融、教育、办公场景探索早、成果多,但现阶段尚未形成完全成熟的应用。营销行业 AGI 将在四个方面引领变革,包括革新内容的创造过程和效率、改变流量的分配和获取方式、提升服务体验、降低商业洞察门槛并颠覆市场研究模式。
零售场景中,围绕效率提升和体验优化,AGI 本轮生成能力的升级促进了 AI 商拍、营销物料生成等全新场景的诞生和发展。同时,围绕 Agent 驱动的商家助手和智能投放,各家电商平台也正在频繁发布更新。
金融行业整体处于应用探索期,正逐步向产品测试期迈进。绝大部分中小型金融机构尚未找到大模型与业务的融合点,对大模型应用处于观望阶段或仅将大模型产品应用于通用业务场景中。部分头部金融机构积极创新,不仅能通过大模型产品解决通用业务问题,还应用于解决非决策类业务问题。个别大型新兴金融科技公司已推出 AI Agent 产品或相关框架,即将迈进市场投放期。
企业服务场景中,文本总结、知识查询等协同办公相关的应用,由于需求明确、同 AGI 现阶段的能力适配性高,发展较为迅速。企业资源管理、供应链管理等涉及多个模块,技术更为复杂且安全性与可靠性要求较高,所以应用程度相对较低。
教育领域中,受智慧校园 / 教师的整体解决方案的成熟度、大模型应用面临技术集成、数据管理以及内容生成质量和匹配性影响,AGI 在学校及教师侧的应用都还处于非常早期的阶段。目前,学生侧的应用大多都还在单点场景进行探索,如作文辅导、英语口语等场景的需求较为明确,且与大模型在语言生成的能力提升适配度较高,因此应用程度相对较高;但像个性化学习这类全流程型的应用,同样仍处于早期阶段。
主题演讲:把握技术创新潮流
汪玉教授:《可持续的智能:大模型高能效系统前瞻》
在首场主题演讲中,清华大学电子工程系教授、系主任兼无问芯穹发起人汪玉探讨了大模型高能效系统的未来。他表示 AI 算法算力需求激增,硬件系统的能耗开销可能导致算力供不应求与能源使用的不可持续。在 AI 2.0 时代,生成式任务的智能算法模型规模扩大,对算力及能量的需求急剧增加。如何使用软硬件协同优化加速大模型计算、降低推理成本,成为大模型设计范式的研究重点。汪玉介绍,利用算法数据特征,面向算法模型、数据结构、数据表示、计算图进行算法电路协同设计的方法,可在保证准确率的前提下优化速度与能效,并展示了其团队如何实现全球首个单块 FPGA 上的 7B 大语言模型高效推理。
汪玉还介绍,他发起的 AI Infra 公司无问芯穹正在产业中实践相关能效方案,并针对部分芯片产能不够的问题,开发了多种不同芯片混合训练的框架。目前已经支持六种不同芯片两两组合间的百卡级别异构混合训练,接下来将支持千卡混训。由于多元芯片性能差别较大,如何在不同芯片之间进行训练负载分配,成为了混训中的一个重要课题。无问芯穹基于自研的一种预测误差小于 3% 的训练性能预测工具,可以实现对不同芯片、不同模型结构的训练性能精准预测,从而实现在多元芯片之间的负载自动切分,提升训练效率。当前,无问芯穹的 Infini-AI MaaS 平台已支持了 30 多个主流开源模型、1 个智谱闭源模型和 8 个芯片品牌,并有望于年底实现从多模型到多硬件的自动路由。结合其底层软硬件协同设计与多元芯片兼容能力,可持续加速大模型计算、降低推理成本。
此外,清华电子系孵化的公司清鹏智能也正在以自研的能源大模型为核心就能源与算力融合发展整体解决方案做相关研究。“算力本身的耗能属性需要能源的保障,同时算力的发展能够反哺能源产业进行数字化升级,在一定程度上决定了智能的可持续发展潜力。”汪玉表示,从面向智能的软硬件协同设计出发,构建 AI 2.0 时代的算力生态,促进算电双力深度融合,可为大模型的可持续发展筑稳根基。
贾扬清:《从互联网到 AI:云产业的重构和演进》
紧接着, Lepton AI 联合创始人兼 CEO 贾扬清讲述了 AI 领域最近一年的趋势和自身的感悟,不仅对互联网到人工智能的转型过程进行回顾,还展望了云产业与 AI 融合的新时代。他表示,AI 已经成为 IT 策略的第三个核心支柱,正极大地促进芯片和云领域的创新。在如今 AI 和大语言模型流行的情况下,很多原本需要整个工程师团队完成的功能任务可以在非常短的时间被创造完成。
同时,贾扬清指出,大模型实际应用中,在公域和私域面对的设计场景是不一样的,对企业来说重要的是找到可以把业务需求和 AI 能力结合起来的方法论。而小模型在企业应用中有很大潜力,不仅便宜、可定制化,而且微调模型在垂直领域能够达到比通用大模型更好的效果。
“云价值主张开始有巨变,只有高性能计算硬件和云原生软件相结合,才能保证 AI 性能。”在贾扬清看来,一个优秀的云化台相较开源 LLM 推理性能提升 3-5 倍,比公共云 GPU 产品更具成本效益,且使开发人员的效率更高。“这是 20 年来,第一次云的基础架构产生革命性的变化。”贾扬清说道。
黎科峰博士:《大模型时代,基于 AI Agent 的数据分析与决策新趋势》
大模型和 AI Agent 是否会颠覆 To B 软件?现场,数势科技创始人兼 CEO 黎科峰博士分享了大模型时代下基于 AI Agent 的数据分析新趋势,以及大模型技术在企业数字化转型中的关键作用。首先,他谈到了大模型和 AI Agent 在企业中的落地场景,包括业务分析、内容生成、企业知识库和风控等专业领域。接着,黎博士指出,作为企业经营的“眼”和“脑”,企业数据分析与决策要经历过往、当前、未来三个阶段:数据从结构化数据到加上部分非结构化数据,再发展到结合行业知识 / 数据;使用人群从数据工程师到业务决策者,最后发展到业务全员。“
大模型和 Agent 的出现,推动了企业数据分析与决策的范式变革。”黎博士表示。同时,企业也要认识到,智能分析 AI Agent 还存在几个要解决的关键问题,包括数据准确性、数据源的全面性、人际沟通的准确性和体验感、产品的智能性、以及数据计算查询效率及性能问题。
此次大会现场,数势科技正式发布智能分析助手 SwiftAgent 2.0,全面解决上述问题,帮助企业实现数据现状 - 数据资产 - 洞察和归因 - 智能决策的完整闭环,有效释放数据价值。
林咏华:《大模型背后的荆棘之路》
北京智源人工智能研究院副院长兼总工程师林咏华带来了以“大模型背后的荆棘之路”为主题的演讲。她表示,大模型一年,AI 开源社区受到前所未有的关注和使用。首要问题是,选择哪个基座模型?当前评测技术的发展跟不上大模型的发展速度,且用于比较大模型性能的各种榜单容易激发各种争议,主要存在的评测问题有三项:第一,评测集被“过拟合”,难以区分真正的模型性能;第二,评测方法陈旧,不能反映大模型新的使用场景;第三,新的大模型能力不断出现。
在训练过程中,基础模型也会出现数据问题,针对行业领域进行持续训练学习是其中的一方面,如数据的来源、已训练数据的遗忘现象如何降低、构造持续训练的数据集、领域数据和通用预训练数据的配比、多种领域数据的训练顺序。林咏华指出,基座模型的变化会影响行业模型性能和行业应用,其性能决定了下游行业模型及行业应用的性能;所依赖的基座模型发生变化后,需重新训练行业模型、重新测试下游模型性能,应用集成后的各种出错处理也要重新打磨。
为此,智源研究院牵头共建了北京人工智能数据平台和高质量训练数据集。推动三大数据使用模式,并研制大模型评测体系及开放评测平台 FlagEval,还开源了面向大模型的 Triton 算子库。“当我们拿到一个大模型(开源 / 闭源)后,一切才刚刚开始。需要各种数据、评测、算力的相关技术攻关才能让模型实现产业的落地。” 林咏华表示。
曹志斌博士:《 The Next Wave:Explore the Strategy on Generative AI》
接下来,亚马逊云科技的全球生成式 AI 产品营销总监曹志斌博士发表了题为《The Next Wave:Explore the Strategy on Generative AI》的深度演讲,分享了全球不同客户的生成式 AI 应用场景,剖析了下一波生成式 AI 技术浪潮中,应采纳的前沿策略与核心应对机制。他表示,生成式 AI 正在创造巨大的商业价值。关于生成式 AI 应用策略,曹志斌博士提出了三点战略建议:明确业务场景适应性;设定全面数据战略;重视实现的方法和工具。
“不会有一个生成式 AI 基础模型能适用所有业务场景。”曹志斌博士表示,评估生成式 AI 用例的适用性,要看团队、可行性、时间表、预算、投资回报率、数据、风险;而选择大模型需考虑到六个方面,包括模型的大小和能力、预训练数据的知识截止时间、推理性能和延迟表现、是否支持灵活微调、可访问性和总体成本开支、模型相关的道德和责任问题。此外,他提到,正确的工具能够简化基础模型的调用和管理,加速构建生成式 AI 应用。
刘威:《腾讯混元大模型技术和应用实践》
随后,腾讯杰出科学家、腾讯混元大模型技术负责人之一刘威分享了腾讯混元大模型技术与应用实践方面的最新进展。他介绍道,腾讯混元当前已升级为万亿级大模型,在这个过程积累大量自研技术,其中包括创新的专家路由 Routing 算法、独创的 MoE Scaling Law 机制以及合成数据技术,实现模型总体性能相比上一代 Dense 模型提升 50%,对比开源 MoE 模型,在代码、数学和多学科能力领先较多。
在文生图方面,腾讯混元实现了基于 LLM + DiT 的生成能力;视频生成上,腾讯混元拥有文生视频、图生视频、图文生视频、视频生视频等多种能力,支持 1k~4k 的分辨率。据悉,目前腾讯混元大模型已接入 600+ 司内业务应用,包括微信读书、腾讯文档 AI 智能助手、腾讯广告妙思文生图平台等。
现场回顾:技术洪流中的灵感碰撞
大会现场人头攒动,座无虚席,气氛热闹非凡。与会者们反映,这次大会分享的内容不仅干货满满,且技术观点足够前沿和创新,让其受益匪浅、意犹未尽,更激发了对 AI 未来发展的无限想象和创新灵感。我们倍感欣慰与鼓舞,对每一位参与者给予的支持与认可致以最诚挚的谢意。未来,我们将继续前行,持续提供优质的技术内容和交流平台,致力于推动技术界的发展与创新,力求一路做技术传播领域的佼佼者。
精彩瞬间:活动亮点集锦
大模型应用生态展
除延续高浓度的技术内容外,本次 AICon 还特别设置了大模型应用生态展,带到场者一起猎奇 AI 智域,探索生成式 AI 的未来可能。其中,讯飞带来可以上手体验的星火大模型 SparkDesk 问答机器人,Rokid 设置了有保卫农场、完美弧线、飞镖大赛等空间计算游戏的灵境虚拟展,商汤将主打“自动生成代码”的代码小浣熊和“聊着天就把数据分析做了”的办公小浣熊产品带给参会者,还有“造车新势力×智驾领航者”蔚来汽车的展车和亚马逊云科技满载生成式 AI 黑科技的大巴车开到现场。
在现场的【OpenTalk】交流区,多位专家大咖与到场的 AICon 开发者们面对面讨论了最新的技术趋势和技术应用经验,议题包括进击的开源大模型、基于混合检索赋能 RAG 和 Agent 应用、商汤大模型在应用场景的落地实践、数据开源如何赋能全球 AI 开源开放生态以及讯飞星火大模型应用生态创新实践等。
此次,展区现场还策划了【Workshop】区域——智能编码工具体验区,无论是资深软件工程师还是代码新手,都有机会在这里亲手试用提升编码技巧的灵感和工具,体验如何通过自然语言处理技术自动生成代码,以及利用 AI 进行代码审查和优化。让我们一起回顾这些精彩瞬间吧!
赞助商展示区
AICon 的圆满举行,离不开赞助商们贡献的力量。在他们的慷慨助力下,我们得以持续推动技术的传播与发展,为行业创新注入不竭源泉。本次 AICon 大会得到了众多赞助商的大力支持,包括数势科技、亚马逊云科技、Google Cloud、支付宝小程序云、UCloud 优刻得、七牛云、百道数据、未来智能、PPIO 派欧云、intel 等。他们的参与不仅为大会增色不少,也为技术共享和行业发展提供了坚实基础。
AICon 晚场活动推荐
与三位业内大咖共议:AI 智能体落地的挑战与应对策略
时间:5 月 17 日 18:30-20:00
这次交流对所有 InfoQ 粉丝免费开放!有线上和线下两种参与形式,扫描下方二维码,即可线上参加。
AICon 特别策划了一场关于 AI 智能体落地的晚场圆桌讨论,邀请的三位业内专家将与大家分享他们的经验和见解,并与听众互动探讨——
蓝莺 IM CEO 梁宇鹏
机器姬 CTO 刘智勇
天弘基金 AI 负责人 平野
期待与你一同深入探讨 AI 智能体落地的挑战与应对策略。
极客邦活动推荐
今年, 极客邦科技旗下 InfoQ 中国已圆满启动两场技术盛会,之后还将于 8 月 18 -19 日举办上海站的 AICon 大会。如您感兴趣,可点击「阅读原文」查看更多详情。结合生成式 AI 领域的一系列最新动态,AICon 上海站将增加围绕多模态实时交互、长文本背后技术能力、AI 智能体相关的应用案例实践等更多话题内容 。
购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。
评论