写点什么

云原生工程实践:企业如何破解 AI 时代架构挑战与成本难题?7 场分享为你揭晓 | QCon

  • 2024-10-15
    北京
  • 本文字数:3275 字

    阅读完需:约 11 分钟

云原生工程实践:企业如何破解 AI 时代架构挑战与成本难题?7场分享为你揭晓 | QCon

在当今快速发展的云原生与 AI 驱动技术领域,企业面临着前所未有的挑战与机遇。随着智能计算服务、大规模容器化应用以及多模态大语言模型的广泛应用,如何在保持创新速度的同时,优化架构、控制成本并确保系统的高效稳定运行成为每个技术团队必须应对的关键问题。


与此同时,业界也逐渐意识到,推动这些技术实践的核心在于代码和系统架构的优化——从可观测性系统的高效设计,到容器集群中对磁盘 IO 的精准管理,再到 Serverless 技术在大语言模型中的灵活应用,这些都在不断塑造未来的技术生态。


在此背景下,在 10 月 18 日 -19 日,即将到来的 QCon 上海站,我们策划了云原生工程实践 专题,邀请高级研发总监携程蔡峰担任专题出品人,为专题进行内容质量把控。蔡峰拥有多年的技术实践和领导经验,引领携程从虚拟机时代、容器化时代到如今的 Kubernetes 时代,不断演进与创新。


本专题,我们邀请了来自阿里云、蚂蚁集团、携程、eBay、网易、微博、亚马逊云科技等顶尖企业的技术专家,分享他们的实践与探索。本文为详细介绍~另外,在本届 QCon 上海站,我们也设置了大模型基础设施与算力优化、AI 应用开发实践、AI 重塑技术工作流程等专题论坛,欲了解更多精彩内容,可点击原文链接查看。

精彩演讲一


随着云原生技术逐渐成为 AI 应用的基础平台,如何构建高效、稳定的可观测性系统以应对复杂的智能计算服务成为了业界关注的焦点。我们有幸邀请到阿里云高级技术专家徐可甲,他是阿里云 iLogtail 开源项目的负责人,长期专注于大数据安全和可观测数据采集等领域,拥有超过 10 年的丰富经验。他将在演讲中带来《面向智算服务构建下一代可观测 Pipeline》的深入分享,探讨如何通过云原生技术推动智算服务的高效运行。


徐可甲将带领大家深入剖析如何在 Kubernetes 容器集群中管理和采集海量数据,重点讲解 iLogtail 如何在智能计算服务的复杂生态中,低成本且高效地构建可观测性数据采集与处理 Pipeline。他将详细解析可观测性系统在大规模多租集群中的技术难点,介绍如何通过优化性能、提升系统稳定性,实现对数据采集的精准控制。


此外,他将结合真实案例,展示阿里云在智算服务场景中的具体技术实践,深入探讨数据采集的全面性、数据隔离性、自动化管控等策略,以及如何解决高并发和性能瓶颈问题。通过本次分享,听众将获得在智算服务领域构建高效可观测性 Pipeline 的宝贵经验,理解如何从容应对智能计算服务中的复杂场景和技术挑战。


精彩演讲二


随着企业逐步转向混合多云架构,如何有效管理和优化成本成为一大挑战。我们荣幸地邀请到携程容器与混合云团队技术专家许钦以及携程资深研发工程师陈丹双


两位专家将以《携程混合多云架构下的 FinOps 实践》为题,分享携程在全球多云架构下的成本管理策略。他们将详细介绍如何通过落地 FinOps 实践,在复杂的多云环境中实现成本洞察、分析与优化。他们也将特别探讨携程如何构建统一的成本可视化平台、创新的计费模型,以及通过精细化分析提高云资源的利用效率。


本次分享将帮助听众深入理解 FinOps 的概念与应用,学习如何在混合多云环境中进行有效的成本管理与优化,提升企业的云资源使用效益与成本控制水平。


精彩演讲三


云原生架构的兴起正在为中间件系统的高可用性和自动化管理带来全新机遇与挑战。作为网易轻舟的资深云原生架构师 ,裴明明在该领域拥有丰富的实战经验,并且是开源项目 Harbor 的维护者。


他将带来《云原生架构下中间件联邦高可用架构实践》的主题演讲,分享网易在云原生技术栈下如何高效管理中间件系统,确保其在跨可用区场景中的高可靠性和高性能表现。


裴明明将深入解析中间件系统在传统架构与云原生架构下的不同管理方式,着重讲解网易如何利用 Kubernetes 联邦集群管理技术实现中间件系统的跨可用区高可用性。通过详解 K8s 中间件集群的联邦能力及其设计原理,他将展示如何解决有状态应用的同步、访问和灾难恢复等核心技术难题,确保中间件的持久性与稳定性。


他还将分享网易在构建云原生可观测性系统时的具体实践,如何通过 Operator 机制优化中间件集群的自动化管理,提升运维效率和集群自愈能力。


此次演讲将为听众带来云原生架构下中间件系统管理的最佳实践,特别是在多租户环境和大规模集群中的高效管理经验,帮助开发者深入理解中间件架构设计与未来发展方向。


精彩演讲四


面对大规模混合部署和容器化场景下的性能需求,磁盘 IO 隔离成为云计算基础设施中最具挑战性的技术难题之一。eBay 资深软件工程师沈涛将以《eBay 云原生磁盘 IO 隔离技术实践》为主题,深入分享他在 eBay 全球云计算基础设施中应对复杂磁盘 IO 隔离问题的解决方案,并展示如何通过云原生技术和 Cgroup v2 实现高效的资源管理和调度。


沈涛拥有丰富的云计算与基础架构开发经验,长期致力于 Kubernetes、云存储和容器运行时的研发与维护工作。他将在演讲中带领听众深入解析 eBay 如何应对因混布导致的 noisy neighbor 问题,以及如何在容器、Emptydir 和 Local PVC 等场景中对磁盘 IO 进行精细化的资源分配与限制。重点介绍基于 Cgroup v2 的 IO 隔离技术,如何通过 IO controller 实现磁盘 IO 的 QoS 管理,确保系统的高性能与高可靠性。


除此之外,他将分享 eBay 在 Kubernetes 磁盘 IO 调度模型中的设计思路,展示如何通过优化调度算法和集群拓扑结构解决资源争用问题,并最终实现节点调度和磁盘 IO 隔离的高效落地。通过此次分享,听众将深入了解磁盘 IO 隔离的核心技术挑战,以及在大规模云原生环境中应对复杂存储需求的实际应用经验,为优化存储系统和提升性能提供重要的思路和参考。


精彩演讲五


随着多模态大语言模型(MLLM)在图文理解、创作、知识、推理和指令遵循等领域的应用不断深入,如何通过强化学习算法优化模型输出成为关键。我们荣幸地邀请到蚂蚁集团高级技术专家何子波, 他是蚂蚁 CTO 线平台工程与技术风险部的核心成员,专注于云原生基础设施代码化及大规模动态配置管理。


他将以《蚂蚁集团配置即代码的规模化实践之路》为题,分享蚂蚁如何通过自主研发的配置领域语言 KCL 和平台编排器 Kusion,成功应对复杂场景的动态配置需求。何子波将深入阐述蚂蚁在多集群架构与 K8s 多租户管理中的技术选型及实践经验,带领大家了解蚂蚁集团在云原生领域的前沿探索。


通过本次分享,听众将了解到云原生动态配置管理和基础设施代码化的最新技术趋势,并学习到蚂蚁如何通过平台化技术栈提升规模化应用的交付效率和稳定性。


精彩演讲六


微博高级技术主管段绪勇将在《微博基于云计算的广告系统架构优化实践》中,为我们带来广告系统在云计算时代的架构创新与优化经验。段绪勇深耕广告引擎开发,现任微博汽车事业部高级技术主管,在广告系统的扩展性和精准投放优化方面积累了丰富经验。


他将深入讲解微博如何利用云计算的弹性扩展与大数据处理能力,提升广告系统的响应速度和资源管理效率。通过具体的实践案例,段绪勇将分享微博在广告系统中的微服务架构、容器化技术,以及基于云计算的大规模广告投放优化方案。


本次演讲将为听众带来广告系统在云时代的架构设计思路,并探索人工智能与广告技术结合的未来趋势。


精彩演讲七


亚马逊云科技高级解决方案架构师姬军翔将带来《Serverless 助力大语言模型工程化实践》的精彩演讲,分享如何利用 Serverless 技术实现大语言模型的快速迭代与低成本部署。姬军翔在通信及电商领域拥有丰富的系统架构设计经验,现负责创新系统的原型验证及大模型项目落地。


他将详细介绍大语言模型的 7 层架构,并通过案例分析展示如何应对大规模模型部署中的弹性伸缩、资源管理等挑战,帮助听众掌握 Serverless 架构下大语言模型的最佳实践。


通过姬军翔的分享,听众将深入了解 Serverless 技术如何推动大语言模型的实际应用,并学习到如何平衡性能与成本,实现高效的模型部署方案。



会议推荐


10 月 18 日 -19 日,QCon 全球软件开发大会将在上海举办。从云原生工程、架构、线上可靠性、大前端、技术管理等经典内容,到 AI Agent、AI Infra、RAG 等大热的 AI 话题,60+ 资深专家共聚一堂,深度剖析相关落地实践案例,共话前沿技术趋势。大会火热报名中,详情可联系票务经理  17310043226 咨询。



2024-10-15 09:594493

评论

发布
暂无评论
发现更多内容

组件发布效率提升15倍是怎么做到的——基于 Gradle 调度机制深度研究与优化

字节跳动终端技术

字节跳动 Gradle Andriod

VuePress 博客优化之开启 HTTPS

冴羽

Vue 前端 博客 vuepress 博客搭建

网络安全——内网渗透完整流程

网络安全学海

黑客 网络安全 信息安全 渗透测试 安全漏洞

微软Office新增实用功能允许用户在不同设备上轻松送同步字体

淋雨

元宇宙时代:银行如何探索数字化转型

CECBC

2022中国低代码十大发展趋势,市场规模预计达42.6亿

J2PaaS低代码平台

低代码 低代码开发 J2PaaS

实时音视频入门学习:开源工程WebRTC的技术原理和使用浅析

JackJiang

音视频 WebRTC IM 即时通讯IM

金融云原生漫谈(五)|如何打造更适合云原生的数据存储方案?

York

云原生 数据存储

到底什么是云?其实云计算从业者也不懂!

Geek_f56666

云计算

关于A股投资--《香帅中国财富报告》摘录(3/100)

hackstoic

投资

ORTC与SIP融合通信服务架构

安第斯智能云

音视频 RTC 流媒体

金融小程序风险如何控制,WeTest小程序质量专项方案一步到位

WeTest

「干货分享」如何做好应急响应工作?常见应急响应流程

H

网络安全 应急响应

重磅功能!Apache APISIX 拥抱 WASM 生态

API7.ai 技术团队

开源 云原生 Wasm Apache APISIX

不优雅的 React Hooks

CRMEB

不是私密链接,如何继续前往?

BUG侦探

https HSTS 劫持

JuiceFS 即将发布 1.0 并调整开源许可

Juicedata

开源 文件系统 云存储

百度智能云以“3D+AI”技术,助力“三亿人上冰雪”

百度开发者中心

人工智能

一个cpp协程库的前世今生(十七)带时限的锁

SkyFire

c++ cocpp

用 SwiftUI 实现一个开源的 App Store

37手游iOS技术运营团队

swift appstore SwiftUI App榜单 App免费榜

龙蜥利器:系统运维工具 SysAK的云上应用性能诊断 | 龙蜥技术

OpenAnolis小助手

开源 运维

酒店资产管理系统解决方案

低代码小观

CRM 企业管理系统 CRM系统 企业管理工具 企业管理软件

Flink 在字节跳动数据流的实践

字节跳动数据平台

大数据 flink 字节跳动 埋点 数据流

LabVIEW实现PCB电路板坐标定位(实战篇—2)

不脱发的程序猿

机器视觉 图像处理 LabVIEW PCB电路板坐标定位

Tengine + BabaSSL ,让国密更易用!

SOFAStack

密码学 tengine 国密 BABASSL

重庆华美:用宜搭实现全流程管理上云,节约超百万研发成本

一只大光圈

前端 阿里 低代码 数字化转型 钉钉宜搭

2022 起始篇

万万

一周信创舆情观察(1.4~1.9)

统小信uos

专有云运维如何更快、更准、更稳?丨智能运维

百度大脑

人工智能

Go语言gorm框架MySQL实践

FunTester

Go MySQL gorm FunTester

虎年前迎来脑科学新锐:脑虎科技的创生故事

脑极体

云原生工程实践:企业如何破解 AI 时代架构挑战与成本难题?7场分享为你揭晓 | QCon_AI&大模型_李忠良_InfoQ精选文章