写点什么

.NET 4.5 中任务并行类库的改进

  • 2011-12-08
  • 本文字数:1734 字

    阅读完需:约 6 分钟

微软正在努力改进.NET 4.5 中应用程序的性能,特别是使用任务并行类库(Task Parallel Library)的那些应用。接下来我会带你预览将要完成的改进内容:

Task, Task

.NET 并行编程 API 的核心是 Task 对象。对于这样重要的类,微软想法设法保证它要尽可能小。Task 的大多数属性都没有保存在类本身之中,而是保存在另一个名为 ContingentProperties 的对象中。这个二级对象会在程序需要的时候才创建,这样就会降低大多数一般情况下的内存占用。

.NET 4.0 发布的时候,最常见的情形是分支合并(fork-join)样式的编程,就像我们在 Parallel.ForEach 和 Parallel LINQ 中看到的那样。然而,有了.NET 4.5 和其中引入的异步机制,顺序样式的编程就取而代之,占据主导地位。微软非常确信这会是主要的方式,因此他们把 ContinuationObject 移动到 Task 中,把其他字段移动到 ContingentProperties 中。这使得顺序结构的代码运行更快,而 Task 对象的规模更小。

Task 也避免了一些不需要的等待。它最初拥有四个属性,但是 Joseph E. Hoag 解释说

由于我们进行了一些很聪明的结构调整,结果只有 m_result 字段才是真正必要的。通过对已经存在于基本的 Task 类中的字段重新利用,我们可以废弃 m_valueSelector 和 m_futureState 字段,而存储在 m_resultWasSet 中的信息可以存储在基本类型的上述状态标识中。

结果创建 Task所需的时间会减少 49-55%,对象的大小会减少 52%。

Task.WaitAll, Task.WaitAny

试想一下,我们需要同时等待十亿个任务。在一台 x64 的计算机上,这会导致 12,000,000 比特的负载,这还没有计算任务本身。如果使用.NET 4.5,负载会降到仅仅 64 比特。同时 WaitAny 的负载也会从 23,200,000 比特降到 152 比特。

之所以出现如此戏剧化的效果,是因为微软改变了使用核心同步基元(kernel synchronization primitives)的方式。在之前的版本中,每个任务都需要一个基元(primitive )。现在已经大大减少,每个等待操作只需要一个基元,与操作中的任务数量无关。

ConcurrentDictionary

在.NET 中,只有引用类型和很小的值类型才能够以原子的方式赋值。较大的值类型——像 Guid——则无法以原子的方式读写。在.NET 4.0 中,为了解决这个问题,ConcurrentDictionary 会使用 node 对象,每次与键值关联的值发生改变的时候,都会重新创建这个对象。在.NET 4.5 中,只有在无法以原子的方式对值进行写操作的时候,才会创建新的 node 对象。

另一项改变是我们可以动态地创建锁。 Igor Ostrovsky 写到

在实践中,为了达到最大吞吐量,往往需要大量锁。另一方面,我们又不希望分配太多锁对象,特别是在 ConcurrentDictionary 最后只存储了很少项目的时候。

想要提升性能,就要减少内存分配

Joseph 写到:

在我们的评测结果中你可以看到,在测试中分配的内存数量和完成测试所需的时间之间有直接关系。当我们单独查看的时候,内存分配并不是非常昂贵。但是,当内存系统只是偶尔清理不使用的内存时,问题就出现了,并且问题出现的频率和要分配的内存数量成正比。因此,你分配越多的内存,对内存进行垃圾回收的频率就越频繁,你的代码性能就会变得越差。

想要降低内存使用,一种方式就是避免使用闭包(closure)。不要在匿名的函数中捕获局部变量,我们可以把它传递给 Task 的构造函数,作为它的“状态(state)对象”。从.NET 4.5 开始,Task.ContinueWith 也会支持状态对象。

另一种减少内存使用的技术是缓存经常使用的任务。例如,假设一个函数会接受一个数组作为参数,并返回 Task。因为对于空数组结果总会是一样的,所以缓存代表空数组的 Task 就很合理。

下一个技巧是避免让任务不必要地“膨胀”。当某些代码触发了创建 ContingentProperties 的操作,Task 对象就会膨胀。最经常出现的原因包括:

  • 创建的任务带有 CancellationToken
  • 任务是从非默认的 ExecutionContext 创建的
  • Task 作为父 Task 参与到“结构化并行机制(structured parallelism)”中
  • Task 以 Faulted 状态结束
  • Task 通过 ((IAsyncResult)Task).AsyncWaitHandle.Wait() 处于等待状态

大家还要记住,任务膨胀并不一定是坏事。它只是需要注意的问题,这样我们就不会做不需要的事情,像传入从来不会用到的 CancellationToken 等。

查看英文原文: Task Parallel Library Improvements in .NET 4.5

2011-12-08 01:043236
用户头像

发布了 340 篇内容, 共 130.3 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

98位企业技术高管入学百度AICA 大模型带来AI人才三大能力要求

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

云原生MYSQL数据库架构分享

谐云

MySQL 云原生

浅谈kubernetes存储—glusterfs故障排查

谐云

kuberedge

代码随想录训练营Day03- 链表(上)

jjn0703

在 Go 中如何实现类似 Python 中的 with 上下文管理器

江湖十年

Go 后端

MySQL笔记之Checkpoint机制

互联网工科生

MySQL 高可用 CheckPoint

什么是WebAssembly及其必要性

谐云

WebAssenbly

基于多尺度图神经网络的流场预测,实现精度与速度的平衡

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

什么是KubeEdge?

谐云

kuberedge kurbernetes

从低谷逆转,数字化转型企业可以信任华为云SparkPack

YG科技

大厂月入3w+,失业焦虑折磨着我

程序员晚枫

程序员 大厂 焦虑

华为云下载加速解决方案:让您的下载更快更稳定

YG科技

ChatGLM2-6B环境搭建

IT蜗壳-Tango

IoTLink版本更新V1.34.0

山东云则信息科技

Java Vue 后端 物联网 前段

开心档之C++ 模板

雪奈椰子

一文讲透 Redis 事务 (事务模式 VS Lua 脚本)

高端章鱼哥

lua redis vs

传统网络环境应付不了企业发展需求,华为云下载加速解决方案体验如何?

YG科技

业财一体,精细管控丨华为云SparkPack助力成长型企业数字化转型

YG科技

2023-07-02:给定一个1~N的排列,每次将相邻两数相加,可以得到新的序列,长度是N-1 再对新的序列,每次将相邻两数相加,可以得到新的序列,长度是N-2 这样下去可以最终只剩一个数字 比如 :

福大大架构师每日一题

Go 福大大架构师每日一题

基于eBPF技术的可观测实践探索

谐云

云原生

福昕软件与国广传媒达成战略合作,共促AI技术创新发展

新消费日报

华为云SparkPack:成长型企业的数字化转型利器

YG科技

es笔记四之中文分词插件安装与使用

Hunter熊

中文分词 elasticsearch

开心档之C++ 数组

雪奈椰子

C++实现对RGB图片进行编码

芯动大师

“科创中国”大湾区青年百人会论坛成功举办

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

边阅读,边成长

少油少糖八分饱

阅读 每天读本书 书评

AI、机器学习、大模型、生成式AI和安全

啸天

人工智能 机器学习 安全 大模型 ChatGPT

代码随想录训练营Day04 - 链表(下)

jjn0703

落地领域大模型应知必会 (1) :主要微调方法总览

Baihai IDP

人工智能 白海科技 大语言模型 大模型微调 领域大模型

.NET 4.5中任务并行类库的改进_.NET_Jonathan Allen_InfoQ精选文章