写点什么

小红书 FinOps 实践:云成本优化与资源效率提升之道 |QCon 北京

  • 2025-03-31
    北京
  • 本文字数:1426 字

    阅读完需:约 5 分钟

大小:764.90K时长:04:21
小红书 FinOps 实践:云成本优化与资源效率提升之道 |QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


小红书混合云资源管理负责人梁啟成已确认出席并发表题为《小红书 FinOps 实践:云成本优化与资源效率提升之道》的主题分享。眼下,云计算已成为众多互联网企业支撑业务运行的关键基础设施,然而云计算的便利性和灵活性也带来了一系列资源成本管理挑战,包括成本增速过快、成本归属不清晰、缺乏有效成本控制手段、对云厂商高度依赖等。本次分享将重点介绍小红书的 FinOps 实践经验,并通过技术优化手段提升资源使用效率,每年节省数亿成本。


梁啟成多年 IT 资源管理与成本优化经验,曾深度参与头部互联网企业上云、大规模在离线业务混部,并持续推进业财一体化以及精细化的混合云资源成本管理,2024 年参与了信通院《IT 基础设施资源运营成熟度模型》标准制定,是 FinOps 文化的践行者。他在本次会议的详细演讲内容如下:


演讲提纲

1. 小红书用云概述

2. 成本优化面临的问题与挑战

  • 分摊云成本与实际资源用量存在偏差

  • 资源规模不断增长但利用效率持续低下

  • 大模型的部署与运行成本高昂

3. 成本洞察与优化实践

  • 技术商品化实现内外账分离

  • 大 Node 小 Pod 策略下的在线业务混部

  • 工作负载性能瓶颈分析

  • 机型收敛与 RightSizing

  • 内容大模型的降本增效

  • 多维并行提升训练效率

  • 量化蒸馏压缩模型大小

  • 算子优化提升推理速度

4. 总结与展望


这样的技术在实践过程中有哪些痛点?

  • 常规按比例分账方法能帮助测算出各业务部门的资源成本费用,但不一定能解释清楚其背后的量价对应关系,进而影响了技术优化方向判断

  • 云厂商硬件经过虚拟化后,不同规格大小虚拟机会存在跨 numa、共用一个 Socket 产生干扰,进而表现出内存性能差、业务 CPU 使用率明显分层、服务 RT 抖动明显等问题,云上客户不得不开通更多资源降低容量水位来保证在线服务不受损,最终造成了成本浪费

  • 高昂的训练和推理成本、高硬件需求、资源利用效率低下,这些问题限制了内容大模型的广泛应用和普及,需要通过技术创新和优化策略来解决


演讲亮点

  • 重点聚焦于建立清晰、透明的成本洞察机制以及配套系统能力建设,尝试分别从买卖家视角梳理清楚各自团队的资源用量、技术成本支出以及收入情况

  • 看清、看准、分析出系统关键性能瓶颈,通过机型迭代、内核优化等措施确保各业务具备将 CPU 跑高的能力,进而执行缩容退机操作达到降低成本的目标

  • 分别从数据、训练、压缩、推理等方面介绍小红书对于内容大模型的降本增效实践

听众收益

  • 可以帮助相关从业人员了解或学习云成本优化的主要技术方案,并在日常工作中进行运用


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。

目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-03-31 14:003628

评论

发布
暂无评论

基于 pytorch-openpose 实现 “多目标” 人体姿态估计

北桥苏

Python OpenCV PyTorch MediaPipe Pytorch-OpenPose

动态规划-序列比对-最长公共子序列

alexgaoyh

Java 编辑距离 最长公共子序列 Smith-Waterman 序列对比

华为云幻兽帕鲁服务器搭建教程(Windows平台)

YG科技

SpringBoot3集成Zookeeper

Java 架构 SpringBoot3 Zookeeper3.8 Curator5.5

聚道云连接器:实现航信费控与用友NCC对接,助力某商贸集团业务升级

聚道云软件连接器

案例分享

元宇宙技术对于虚拟仿真应用的一些帮助

3DCAT实时渲染

虚拟仿真 元宇宙 元宇宙解决方案

外贸独立站如何SEO优化推广?

九凌网络

杭绍甬高速杭绍段等浙3条高速通车,三思再树标杆工程。

电子信息发烧客

理解ETF的风险:透明度高、投资组合清晰可见背后的考量

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

魔搭+ 函数计算: 一键部署,缩短大模型选型到生产的距离

Serverless Devs

容器 云原生 中间件 函数计算 函数计算FC

Yuliverse:引领区块链游戏新篇章!

Footprint Analytics

区块链游戏 元宇宙 链游 Web3 游戏

i人事2023:在不确定性的年份做正确的事情

ToB行业头条

Apifox 1月更新:性能测试、多人协作接口实时同步功能全面解析

Apifox

程序员 性能测试 Apifox API 接口工具

2023 年度龙蜥最佳用户案例奖揭晓,中国移动、小红书、中国人寿财险等企业上榜!

OpenAnolis小助手

开源 操作系统 用户案例 龙蜥社区 商业版

走出大模型部署新手村!小明这样用魔搭+函数计算

Serverless Devs

容器 中间件 函数计算 函数计算FC

定向减免!函数计算让 ETL 数据加工更简单

Serverless Devs

容器 云原生 中间件 函数计算 函数计算FC

电商平台接口自动化测试框架设计与实现

技术冰糖葫芦

API

一文搞清楚Java中的包、类、接口

不在线第一只蜗牛

Java 前端 开发

惊为天人!这个保存推特视频到手机相册的办法真的一绝!

frank

twitter

实现定时任务的六种策略

不在线第一只蜗牛

前端 定时任务 开发

二、nextjs API路由如何做好JWT登录鉴权、身份鉴权,joi字段校验,全局处理异常等(c-shopping电商开源)

Geek_9da61c

开源 JWT next.js joi

小红书 FinOps 实践:云成本优化与资源效率提升之道 |QCon北京_云计算_QCon全球软件开发大会_InfoQ精选文章