AICon议程上新60%,阿里国际、360智脑、科大讯飞、蔚来汽车分享大模型探索与实践 了解详情
写点什么

QCon 广州站盛大开幕,AIGC 浪潮势不可挡,探索大模型的挑战与机遇

QCon

  • 2023-05-26
    北京
  • 本文字数:2752 字

    阅读完需:约 9 分钟

QCon广州站盛大开幕,AIGC浪潮势不可挡,探索大模型的挑战与机遇

QCon 全球软件开发大会是由极客邦科技旗下 InfoQ 中国主办的综合性技术盛会,每年在伦敦、北京、纽约、圣保罗、上海、旧金山召开。自 2007 年 3 月份开始举办以来,已经有超万名有多年从业经验的技术人员参加过 QCon 大会。QCon 内容源于实践并面向社区,演讲嘉宾依据热点话题,面向 5 年以上工作经验的技术团队负责人、架构师、工程总监、开发人员分享技术创新和实践。


今天,由极客邦科技旗下 InfoQ 中国主办的QCon全球软件开发大会(广州站)顺利开幕。作为这场综合性技术盛会的一部分,我们非常荣幸地邀请到了众多优秀的演讲嘉宾,他们将带来丰富多彩的主题演讲和分享。


大会在 09:00-09:10 开场,由极客邦科技副总裁兼 TGO 鲲鹏会总经理杨攀致辞。杨攀以"AGI 与 AIGC 浪潮下的我们"为主题,为我们拉开了 QCon 广州的开幕式。杨攀提到,“人间一日,AGI 一年”,人类科技的转折点已到来,我们技术岗位的每一位同行者,都应该思考如何利用 AGI 提升效率。他坦言,技术人应该了解理论基础、前沿技术、开发实战以及产业落地方面,以更好地跟上时代的发展。



紧接着,09:10-09:15 期间,极客邦科技的会议主编邓艳琴(Clara)介绍了"QCon 内容策划思路与参会指南",为与会者提供全面的指导。她谈到,曾经还有参会者质疑大模型是否会改变开发范式,但现在这一点已成为现实。在此次会议的专题设置上,AIGC 占了整个分享不小的篇幅。InfoQ 组委会也设置了大模型特色晚场以及大模型体验区,供参会者互动交流,期待大家满载而归。



接下来,在 09:15-09:45 的时间段,商汤集团的联合创始人兼大装置事业群总裁杨帆分享了"大模型浪潮下,商汤的布局与思考",探讨商汤在这个潮流中的发展和思考。杨帆从大模型的核心技术变化入手,分享了商汤日日新大模型的实践探索。

 

杨帆提到大模型的参数量一直在变多,Transformer 的出现使得模型变大的成本大大降低,相对于聊天机器人来说,AI for science 是他认为对人类改变最大的地方。大模型时代走到最后一定是巨头的游戏,更多人的发展空间是在其上层的产业应用。AIGC 浪潮已不可逆转,在这个时刻,非常有可能产生重大的机会。

 

大模型的生产链条包括基模型预训练、精调以及大模型推理服务。他认为,AI 看起来改变了世界,核心的原理是暴力美学——量变引起质变,算力、算法、以及数据的最佳实践,但是背后有一点是存在很多待优化的事情。例如,算力方面,GPU 卡连接过多时,其训练任务稳定性,随着国模快速递减;模型结构方面,需要更优秀的模型结构,精度/效率的权衡和更先进的微调方案设计;最后,数据来源、质量以及多样性覆盖度的挑战。这里存在着许多创业以及工作的机会。

 


随后,在 09:45-10:30 的时间段,京东集团的副总裁包勇军先生介绍了"京东数智化关键技术及应用实践",包勇军提到后疫情时代零售产业面临的挑战有扩内需促消费、多元化消费场景、跨境电商 DTC 兴起、新兴消费品牌崛起。

 

京东围绕成本、效率、体验三个方向,构建了大模型、多模态、端智能隐私计算、运筹优化等数智化创新技术体系,通过技术的创新应用,驱动营销、交易、供应链能力升级。京东自研支持万亿级参数超大模型,可支持在线模型异构计算,毫秒级推理以及离在线一体分钟级在线学习;多模态预训练技术支持全品类、全信息源商品内容理解;端智能技术支持电商模型高时效性应用;隐私计算技术在数据安全与合规的基础上,支持业务模式创新;运筹优化技术支持零售供应链高效流转保障。

 

在京东数智化应用实践方面。营销数智化提升营销效能,升级购物体验;全渠道交易数智化打开零售发展天花板,支撑多业务场景;供应链数智化持续优化供应链成本、效率与体验。



紧接着,10:30-11:00 的时间段,人瑞人才科技集团的 CEO 张建国先生将探讨"数字技术人才的井型模型",分享数字时代人才培养和发展的关键模型。张先生提到《财富》500 强中超过半数的公司应用胜任力模型。在一项基于全球 426 家著名公司的调查中,有 80%的公司在人力资源管理实践中应用胜任力模型。他逐一介绍了 T 型人才、π型人才、以及数字化时代的“井”型人才。张总分享到,数字技术人才能力建设必须符合企业数字化的组织能力需求,技术专业能力只是重要的一部分,但更多体现在创新能力、问题解决能力、团队协作等能力结构的变化。



而 11:00-11:30 这个时间段,小红书的技术副总裁凯奇带来了"AI 时代的降本增效"的演讲,探讨人工智能时代如何实现降低成本、提高效率。凯奇认为 AI 对降本增效有巨大帮助。“AI 技术可以更好的帮我们做成本优化,因为 AI 技术本质上是一个非常高效的优化器(在给定优化目标之后);AI 技术可以更好的帮我们做成本洞察,对成本和效能相关数据做预测和异常发现。”


凯奇谈到,小红书在数据、训练、推理、以及向量检索方面做了许多优化动作。具体来说包括


  • 使用列存格式 (Parquet) 和数据湖技术存储和管理训练数据;

  • 引入异步流水线将计算和通讯尽量互相覆盖,引入大 batch 及半精度通信提升通讯效率,针对异步可能存在的效果影响做了一定的算法修正;

  • 将 worker 分拆为 CPU worker 和 GPU worker 分别负责不同计算和通讯任务,通过动态路由进行灵活配比,两者利用率同时得到大幅提升,同等成本下训练速度提升 20%

  • 对模型进行结构化重构,将多次的 CPU-GPU 传输,变为单次 memcopy 的同质化实现

  • 通过特征抽取 C++ 化、广播优化、大 batch 合并进一步提升了非图内计算的效率

  • 针对小红书实际场景中 QPS 高但单 QPS 计算量小的特点,基于多流和多批处理设计并开发了一套向量检索异构 GPU 并行框架和高效的距离计算及 GPU TopK 排序内核,同等吞吐约束下,成本相较 CPU 架构 优化 35%

 

另外,小红书在 AI for 降本增效实践方面,主要体现在成本动因预估、智能算力分配、 视频带宽优化、 智能视频缓存、Github Copilot、Data Copilot 等。



最后,在 11:30-12:00 的时间段,麦当劳中国的数字化副总裁汤海涛介绍了"麦当劳中国的数字化变革",汤总从互联网对企业数字化的影响入手,分享了从 C 端切入,讲述了在产研上麦当劳的实践。汤总分享了许多麦当劳在统一的交互设计、瀑布和敏捷的探索结合、自研 DevOps 平台 Ninja、公有云和私有云的配合以及系统之间的 API 生态等方面的内容,为正在转型的企业提供了新的视角。



到这里,上午的所有分享就结束了。通过 QCon 大会,听众可以与顶尖的技术专家和领导者互动交流,了解最新的技术趋势和最佳实践。同时,大会也提供了一个共享经验和知识的平台,促进了技术社区的发展和合作。


当然,一场大会的顺利举办,离不开所有共创伙伴的大力支持,在此,对大家表示最诚挚的感谢。



让我们一起期待 QCon 全球软件开发大会为我们带来的精彩内容和难忘经历!


谢谢大家!

活动推荐


2023 年 9 月 3 - 5 日,在北京·富力万丽酒店, QCon 全球软件开发大会(北京站)已开启,现已开启售票,提前订票,可享受 7 折早鸟价,购票参会可以直接电话 / 微信联系票务经理 18514549229。

2023-05-26 15:305307

评论

发布
暂无评论
发现更多内容

架构师训练营 - 第 2 周命题作业

红了哟

游戏夜读 | RPG的美式和日式

game1night

啥是CPU缓存?又如何提高缓存命中率呢?

八两

大话设计模式 | 3. SOLID原则

Puran

设计模式

程序员的晚餐 | 6 月 20 日 随便牛肉和翡翠白玉

清远

美食

LeetCode | 4. Palindrome Number 回文数

Puran

Python C# 算法 LeetCode

终于有人把 java代理 讲清楚了,万字详解!

root

Java jdk 后端 动态代理 cglib

Git 基础知识学习

LeoBing

ArrayList哪种循环效率更好你真的清楚吗

root

Java 后端 ArrayList 循环效率 方式

从拼多多突破阿里和京东两大巨头绞杀,市值破千亿美金来看职业价值链

非著名程序员

程序员 程序人生 职业规划 职业成长

架构师训练营第二周作业

陈靓-哲露

[安利] 可能会让你爱上书写的工具组合!

猴哥一一 cium

Typora markdown markdown编辑器 玩转写作平台

优化工程师逻辑视角下的微信“拍一拍”功能

Earth_Polarbear

人工智能 微信 系统工程 优化逻辑

架构师训练营第三周学习总结

张明森

区块链系列教程之:比特币的钱包与交易

程序那些事

比特币 区块链 智能合约 钱包 交易

golang-pprof实战笔记

卓丁

pprof 性能分析 Go 语言

【Golang runtime学习笔记-启动过程分析】

卓丁

初始化 runtime 汇编 Go 语言

如何做好职场印象管理?

石云升

职场 印象管理 职场形象

[架构师训练营] 2 依赖倒置

悬浮

架构师训练营 - 第2周学习总结

红了哟

软件设计原则

yupi

效率思维模式与Zombie Scrum

易成研发中心

敏捷开发

Kafka面试题:基础27问,必须都会的呀!

Java小咖秀

大数据 kafka 分布式 队列 延时消息

在项目中随手把haseMap改成了currenHaseMap差点被公司给开除了

root

Java 后端 BigDecimal金额 Arrays.asList

一款跨平台免费的开源 SQL 编辑器和数据库管理器!

JackTian

数据库 sql GitHub 开源 实用工具

策略模式解析

Seven七哥

设计模式 策略模式

Java操作Excel竟如此简单

生命在于折腾

Java EasyExcel

SpringIOC 是依赖倒置吗?

yupi

架构师第二周学习总结

陈靓-哲露

由一次管理后台定时推送功能引发的对 RabbitMQ 延迟队列的思考 (二)

LSJ

Java RabbitMQ 延迟队列 优先级队列

实现一个redis命令--nonzerodecr

老胡爱分享

redis 源码分析 源码阅读

QCon广州站盛大开幕,AIGC浪潮势不可挡,探索大模型的挑战与机遇_QCon_InfoQ精选文章