写点什么

大模型时代,架构师们应该关注些什么?

  • 2024-03-19
    北京
  • 本文字数:2372 字

    阅读完需:约 8 分钟

大模型时代,架构师们应该关注些什么?

2024 年注定是 AI 热度持续上升,应用落地加速深化的一年。在这个过程中,为匹配前端交互模式变化,适应日益复杂的业务需求,背后的架构也必然迎来新一轮革新。


比如,在基础架构层,为支撑 AI 复杂任务,容器等云原生技术将出现短板。目前,深度学习、大数据处理等数据计算密集型任务已经广泛采用容器、Kubernetes、微服务等一系列云原生技术,但这些任务的计算规模和复杂度远比 Web、微服务等互联网应用要高。为了支持这类工作负载,Kubernetes 就需要做很大的增强,包括核心调度、异构资源统一管理、利用率优化、可观测性、故障诊断和自愈等,甚至整体的架构和生态都需要做很多增强。


比如,在运维层面,结合 AIGC 与 AGI 的发展趋势来看,AIOps 智能化运维方面的探索已过渡到参考自动驾驶的 L0-L5 成熟度模型来度量的阶段 ,这使得行业开始从整个软件的全生命周期来思考 AI 的赋能和提效。这些前期的探索和畅想仍然强调了开发过程的标准化和资源的平台化,要求整个软件研发过程都能够友好地与 AI 协同工作。


同时,以 AIOps、知识库与问答机器人、流程机器人、代码生成等为代表的应用场景将进一步得到深化和拓展,为整个软件工程行业带来效率提升;至于软件研发模式方面,短期内依然会保持现状,但我们不得不在软件设计方面考虑到面向 AI 的 API。


在这个过程中,架构师就像是整个系统的设计大师,负责操刀整个系统架构的规划。这个规划不仅仅包括技术选型、架构模式、演进变化,还得考虑业务需求、团队能力、可运维性、成本等一系列不那么技术的要素。可以说,在大模型时代下,架构师们面临着前所未有的艰巨挑战。


基于这一背景,InfoQ 旗下 ArchSummit 全球架构师峰会年度主题将围绕“智能进阶. 架构重塑”,探讨在 AI 浪潮下,企业架构如何适应大模型时代趋势。


在 6 月 14 日 - 6 月 15 日即将举办的 ArchSummit 全球架构师峰会(深圳站) 上,我们策划了多个与大模型相关的专题论坛,邀请各界专家分享他们的实践经验和前沿探索。


面对大模型训练对于底层算力基础设施提出的更高要求,如更大的带宽和低时延的网络,并行计算加速及开发框架,分布式算力与大内存等,智能计算平台基于独有的网络架构 (如 IB,RoCE 等),独特的虚拟化方式 (基于虚拟机 / 容器的 GPU 虚拟化),独特的算力调度平台,海量的并行存储系统等成为企业的选择。


《智算平台建设与应用实践》专题中,我们将邀请来自 vivo 研究院等机构的智算平台领域专家,分享构建智算平台的技术要点,以及在实践和落地过程中所作的优化和踩过的坑。



监控运维产出的海量数据常受数据质量波动、标注不足和链路上下文信息缺失等问题影响,这些挑战为 AIOps 的应用带来了不小的难题。伴随 LLM 的崛起,业界对其在多模态数据理解和处理上的能力抱以厚望,期待 LLM 能优化 AIOps 在数据理解、关联和交互体验上的表现。


《AIOps 业务场景最佳实践》专题中,我们将聚焦 AIOps 在不同业务场景中的实际成效,比如“如何通过 AIOps 推动可量化的业务价值增长和效率提升”等话题,邀请来自腾讯文档、网易云音乐、群核科技、字节跳动、阿里云等企业的技术专家,分享他们在实际业务场景中利用 AIOps 提升业务效能时遇到的难题、挑战、以及他们的解决方案、模型、架构,和取得的可度量的业务价值。此外,我们还将探讨 LLM 时代下 AIOps 的创新架构,以及 LLM 如何为 AIOps 带来新的变革和潜能。






数据与人工智能的关系密不可分,缺少数据的模型算法只是一副空壳。在 《Data 4 AI 和 AI 4 Data 方面的探索和实践案例》专题 中,我们将探讨数据与人工智能相互驱动的关系。分享在构建数据驱动 AI 系统时的最佳实践,包括数据质量管理、特征工程、数据增强等方面的经验。这里面还涉及到数据结构和数据治理、数据保护、数据管理优化等具体实践,以及超融合数据架构在 AI 应用上所做的设计及优化。


来自百度、Uber、eBay、ProtonBase 小质科技、货拉拉等企业的技术专家,将带来他们各自领域内的探索和实践。






深入场景应用,为企业业务带来实际价值,是大模型技术的“最后一公里”。在 《基于大模型应用层的探索》专题中,我们将探讨如何从应用层面充分发挥大模型的优势,挖掘其潜在的巨大价值。涵盖从选择适合的大模型,到对这些模型进行精细化的性能调优等内容,带领大家一步步理解大模型的运作机制和应用技巧。


此外,我们也关注大模型的集成与部署策略。如何将大模型嵌入到现有应用中,如何才能让它们在实际环境中发挥最大的效益,这些都将专题讨论的重点。


与此同时,大模型与现有系统的协同运作也尤为关键。我们将探讨如何打破大模型与现有系统之间的边界,构建最优化的互动模式,让大模型和现有系统无缝对接,以创造更大的价值。


来自华为云、腾讯云、平安壹钱包等企业的技术专家将通过这个专题,和大家一起探索大模型在应用层面的无穷可能。




当然,我们相信,未来 AI 在架构领域的应用也会逐渐增多,包括 AI 辅助设计、决策支持与建议、智能监控等方面,从而提高架构设计的智能水平。对于架构师而言,不但要学习如何设计出能够满足 AI 需求的技术架构,同时,还要学会与 AI“相处”,让 AI 为自己所用。


因此,我们同样关注技术人成长,研发技能、管理技能提升。在 《架构师顺应时代变化的成长之路》专题中,来自各个领域的专家将分享他们的亲身经验,帮助大家根据自身的条件和兴趣做好职业规划,发展自己的技能图谱,找到属于自己的路,相信会引起很多技术人的共鸣。


除此之外,大模型基础框架、LLM 作为新一代 OS 的探索、AI 大模型中台实践探索等与大模型紧密相关的专题也在持续筹备上线中,如果你感兴趣来会议上演讲,欢迎点击链接进入 ArchSummit 会议官网,提交议题:https://archsummit.infoq.cn/2024/shenzhen/topic


会议现已进入 8 折早鸟购票阶段,可以联系票务经理 17310043226 , 锁定最新优惠。欢迎扫描上方二维码添加大会福利官,免费领取定制福利礼包。

2024-03-19 16:109170

评论

发布
暂无评论
发现更多内容

人工智能 | 文生图大模型

测吧(北京)科技有限公司

测试

制作并量化GGUF模型上传到HuggingFace和ModelScope

GPUStack

大模型 ModelScope LLM huggingface GGUF

在后LLM时代,关于新一代智能体的思考

澜舟孟子开源社区

人工智能 智能体 大模型

RK品牌双十一狂欢,高颜值低延迟键盘超值体验!

科技热闻

高性能日志结构化引擎 — GreptimeDB Piepline 设计与实现技术揭秘

Greptime 格睿科技

时序数据库 日志储存 日志引擎

制作并量化GGUF模型上传到HuggingFace和ModelScope

SEAL安全

大模型 ModelScope LLM huggingface GGUF

湖南长沙正规等保机构名单以及地址看这里!

行云管家

等保 等保测评 长沙

8+ 典型分析场景,25+ 标杆案例,Apache Doris 和 SelectDB 精选案例集(2024版)电子版上线

SelectDB

数据库 数据分析 经验分享 大数据 开源 案例集

王慧文回归带队美团探索 AI 应用;对话音频开源模型 Hertz-dev:120 毫秒超低延迟丨 RTE 开发者日报

声网

解析Go切片:为何按值传递时会发生改变?|得物技术

得物技术

golang 扩容 切片

阿里云 DataWorks 正式支持 SelectDB & Apache Doris 数据源,实现 MySQL 整库实时同步

SelectDB

数据库 大数据 数据分析 数据迁移 整库同步

【等保小知识】等保测评等级从高到低怎么排序?

行云管家

等保 等级保护 等保测评

怎么自动保存ppt?3个必备的ppt使用技巧分享!

职场工具箱

人工智能 效率工具 办公软件 AIGC AI生成PPT

Reviewbot 开源 | 为什么我们要打造自己的代码审查服务?

大卡尔

DevOps Code Review 工程实践 静态代码检查

告别复杂判断!Python中实现函数重载的终极技巧

LLLibra146

Python 装饰器 函数重载

香港 Web3 一周大事记: 香港财政司司长表示,年内有望再发出多个虚拟资产交易平台牌照

TechubNews

Sentieon软件快速入门指南

INSVAST

基因数据分析 生信服务 Sentieon

GeoAI驱动土地价值重塑!中国地质大学(武汉)&和鲸社区Workshop圆满结束!

ModelWhale

Workshop 地球科学 geoai 遥感数据

数字化落地过程中的研发效能治理如何开展?

思码逸研发效能

DevOps 研发管理 绩效管理 研发度量 研发效能度量

GreptimeDB 首位独立 Committer Eugene Tolbakov 是怎样炼成的?

Greptime 格睿科技

开源 时序数据库

Grafana GreptimeDB 数据源插件上线啦,全面替代 Prometheus 插件

Greptime 格睿科技

Grafana 时序数据库 Promethues

启信宝产业洞察:广东领跑低空经济,无人机产业强势崛起

合合技术团队

人工智能 算法 无人机 科技

MongoDB面试专题33道解析

威哥爱编程

数据库 mongodb 面试

《深入浅出Apache Spark》系列③:Spark SQL解析层优化策略与案例解析

数新网络官方账号

sql 大数据

【JIT/极态云】技术文档--模型简介

武汉万云网络科技有限公司

低代码 开发工具

压力测试,探索服务器性能瓶颈

测试人

软件测试

鸿蒙接入Flutter3.22

龙儿筝

探索电商平台API接入的多样路径

代码忍者

API 接口 pinduoduo API

JAVA 应用实现 APM 自动注入(主机篇)

观测云

Java

南开大学携手和鲸科技,以 AI 赋能交叉学科人才培养与课程建设

ModelWhale

Python 人工智能 新文科 南开大学

主机上云,八仙过海?!

白洞计划

AI

大模型时代,架构师们应该关注些什么?_架构_ArchSummit_InfoQ精选文章