限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

Go 运行时:4 年之后

  • 2022-10-11
    北京
  • 本文字数:1884 字

    阅读完需:约 6 分钟

Go运行时:4年之后

自 2018 年以来,Go GC,以及更广泛的 Go 运行时,一直在稳步改进。近日,Go社区总结了 4 年来 Go 运行时的一些重要变化。


这些重要变化主要是:

  • sync.Pool 是一种 GC 感知的重用内存的工具,具有较低的延迟影响,并且能够比之前更有效地回收内存。(Go 1.13)

  • Go 运行时能够更主动地将不需要的内存返回给操作系统,减少了内存消耗和出现内存不足的可能性。这将减少最高 20%的空闲内存消耗。(Go 1.13 和 1.14)

  • 在许多情况下,Go 运行时能够更容易地抢占 goroutine,最高可减少 90%的 stop-the-world 延迟。(Go 1.14)

  • Go 运行时能够比以前更有效地管理计时器,特别是在拥有多核 CPU 的机器上。(Go 1.14)

  • 在大多数情况下,现在使用 defer 语句的函数调用的开销与常规函数调用一样少。点击这里观看 Gophercon 2020 的相关演讲。(Go 1.14)

  • 内存分配器的慢路径对 CPU 核心的伸缩性更好,将吞吐量提升了最多 10%,并将尾部延迟降低了最多 30%,特别是在高度并行的程序中。(Go 1.14 和 1.15)

  • Go 内存统计数据现在可以通过更细粒度、更灵活、更高效的 API(runtime/metrics 包)来访问。这将获取运行时统计信息的延迟减少了两个数量级(从毫秒到微秒)。(Go 1.16)

  • Go 调度器在寻找新任务时花费的 CPU 时间减少了 30%。(Go 1.17)

  • Go 代码现在在 amd64、arm64 和 ppc64 上遵循基于寄存器的调用约定,将 CPU 效率提升了最多 15%。(Go 1.17 和 1.18)

  • Go GC 的内部审计和调度已经进行了重新设计,解决了长期存在的各种与效率和健壮性相关的问题。对于 goroutine 占内存使用很大一部分的应用程序来说,这显著降低了应用程序的尾部延迟(最高达 66%)。(Go 1.18)

  • Go GC 现在在应用程序空闲时会限制自己的 CPU 使用。这将空闲应用程序的 GC 周期的 CPU 使用降低了 75%,从而减少可能导致作业调度器混淆的 CPU 峰值。(Go 1.19)


这些变化对用户来说大多是看不见的——他们只需要升级 Go,就可以看到他们所熟悉和喜爱的 Go 代码运行得更好了。


一个新的“旋钮”


Go 1.19 带来了一个期待已久的特性,使用这个特性需要做一些额外的工作,但它具备很大的潜力:Go 运行时的软内存限制。


多年来,Go GC 只有一个调优参数——GOGC。GOGC 允许用户在 CPU 开销和内存开销之间做出权衡。多年来,这个“旋钮”为 Go 社区提供了很好的服务,被用在各种各样的场景中。


Go 运行时团队一直不愿意在 Go 运行时中添加新的旋钮,他们的理由很充分——每个新的旋钮代表了配置空间中的一个新的维度,我们需要对其进行测试和维护,而且可能要永远持续下去。旋钮的激增也给 Go 开发人员增加了理解和使用它们的负担,随着旋钮的增多,情况会变得愈加困难。因此,Go 运行时总是倾向于用最小配置实现合理的行为。


那么为什么要添加内存限制旋钮呢?


内存不像 CPU 时间那么具有可互换性。对于 CPU 时间,如果稍等片刻,将来总会得到更多的 CPU 时间。但对于内存,你所拥有的总是有限的。


内存限制解决了两个问题。


首先,当应用程序的内存使用峰值不可预测时,仅靠 GOGC 几乎无法防止内存被耗尽。如果只使用 GOGC,Go 运行时根本不知道它有多少可用的内存。通过设置内存限制,运行时能够意识到什么时候需要更努力地工作以减少内存开销,从而使运行时能够健壮地应对瞬时的、可恢复的负载峰值。


第二是为了避免不使用内存限制时出现的内存不足。我们必须根据内存峰值调优 GOGC,而为了保持较低的内存开销会导致更高的 GC CPU 开销,即使应用程序没有处于内存使用峰值且有足够的可用内存。这在容器化的环境中尤其重要。在容器化的环境中,程序被部署在具有独立预留内存的容器中。设置内存限制可以为峰值负载提供保护,并可以针对 CPU 开销更主动地调优 GOGC。


内存限制的设计旨在易用性和健壮性。例如,它是对应用程序中 Go 部分的整个内存占用的限制,而不仅仅是 Go 的堆,因此用户不需要额外计算 Go 运行时的开销。运行时还会根据内存限制调整其内存清除策略,以便在内存出现压力时更主动地将内存返回给操作系统。


虽然内存限制是一个强大的工具,但在使用时仍然要谨慎。其中一个需要注意的地方是,它会让你的程序陷入 GC 抖动状态——在这种状态下,程序运行 GC 的时间过多,导致没有足够的时间来处理其他任务。例如,如果内存限制设置得比程序实际需要的内存少,Go 程序可能会崩溃。以前不太可能出现 GC 抖动,除非显式对 GOGC 进行了大量调优。我们选择让内存耗尽而不是陷入抖动状态,因此作为一种缓解措施,运行时将 GC 限制为总 CPU 时间的 50%,即使这样会超过内存限制。


所有这些都需要慎重考虑,因此,作为这项工作的一部分,我们发布了一个新的 GC 指南,其中包含了交互式可视化的图表,以帮助你们理解 GC 成本以及如何操作它们。


更多可以查看 GC 指南:https://go.dev/doc/gc-guide


原文链接:https://go.dev/blog/go119runtime

2022-10-11 17:355848

评论

发布
暂无评论
发现更多内容

软件测试学习笔记丨Junit5参数化用例

测试人

软件测试 JUnit

唯品会商品数据采集丨唯品会商品详情数据接口(VIP.item_get)

tbapi

唯品会商品详情数据接口 唯品会 唯品会商品数据采集

TDengine 助力中电启明星处理高复杂性和大数据量时序数据

TDengine

数据库 tdengine 时序数据库

CBAM注意力模型介绍

天翼云开发者社区

深度学习 注意力机制 CBAM

浅谈OpenStack(一)

天翼云开发者社区

云计算 OpenStack

中国唯一云厂商!腾讯云大数据入选Gartner®亚太区云数据库管理系统客户之声“客户之选”

腾讯云大数据

腾讯云 大数据

TDengine 与英特尔 AVX512 高级向量扩展指令集成,实现数据并行处理

TDengine

数据库 tdengine 时序数据库

苏宁商品数据采集丨苏宁商品详情数据接口(suning.item_get)

tbapi

苏宁 苏宁API接口 苏宁商品数据采集 苏宁商品详情数据接口

速卖通平台数据采集丨速卖通商品详情数据接口(aliexpress.item_get)

tbapi

速卖通商品详情数据接口 速卖通API接口 速卖通

大型国民老牌药品医疗企业如何借助实时数仓冲破数据孤岛桎梏,拥抱数据驱动的经营管理模式

tapdata

数据孤岛解决方案 多源异构数据融合 doris实时数仓

一文解读加密货币行业的 7 大新兴趋势

TechubNews

HPC的基本概念

天翼云开发者社区

云计算 HPC 高性能计算

鸿蒙开发之视频解码优化以保持后台性能

彭康佳

鸿蒙 音视频

curl 使用:命令行中的 HTTP 客户端

左诗右码

Linux

信创里程碑:TapData 人大金仓数据库产品完成兼容互认证,携手推进自主创新建设

tapdata

信创国产化 人大金仓kingbasees TapData 实时数据平台 国产信创数据库

Wakelocks 框架设计与实现

不在线第一只蜗牛

前端 前端框架 开发框架

聚焦可持续:Autodesk与广东代表团共论绿色发展

E科讯

TiDB体系架构

天翼云开发者社区

关系型数据库 TiDB

每秒50万行——MySQL写入压测并发实践

FunTester

Linux 软件安装与卸载

左诗右码

Linux

如何解决Oracle数据表入库中文乱码问题

伤感汤姆布利柏

2024 HarmonyOS创新赛获奖名单出炉,共29款鸿蒙原生应用及元服务获奖!

最新动态

PostgreSQL 技术内幕(十七):FDW 实现原理与源码解析

酷克数据HashData

postgresql

面试前最应该做的准备工作

老张

面试 职场成长 面试经验 面试技巧

高效DEBUG事务正确性BUG

MatrixOrigin

云原生数据库 国产数据库

Go运行时:4年之后_语言 & 开发_Michael Knyszek_InfoQ精选文章