写点什么

.NET 4.5 中任务并行类库的改进

  • 2011-12-08
  • 本文字数:1734 字

    阅读完需:约 6 分钟

微软正在努力改进.NET 4.5 中应用程序的性能,特别是使用任务并行类库(Task Parallel Library)的那些应用。接下来我会带你预览将要完成的改进内容:

Task, Task

.NET 并行编程 API 的核心是 Task 对象。对于这样重要的类,微软想法设法保证它要尽可能小。Task 的大多数属性都没有保存在类本身之中,而是保存在另一个名为 ContingentProperties 的对象中。这个二级对象会在程序需要的时候才创建,这样就会降低大多数一般情况下的内存占用。

.NET 4.0 发布的时候,最常见的情形是分支合并(fork-join)样式的编程,就像我们在 Parallel.ForEach 和 Parallel LINQ 中看到的那样。然而,有了.NET 4.5 和其中引入的异步机制,顺序样式的编程就取而代之,占据主导地位。微软非常确信这会是主要的方式,因此他们把 ContinuationObject 移动到 Task 中,把其他字段移动到 ContingentProperties 中。这使得顺序结构的代码运行更快,而 Task 对象的规模更小。

Task 也避免了一些不需要的等待。它最初拥有四个属性,但是 Joseph E. Hoag 解释说

由于我们进行了一些很聪明的结构调整,结果只有 m_result 字段才是真正必要的。通过对已经存在于基本的 Task 类中的字段重新利用,我们可以废弃 m_valueSelector 和 m_futureState 字段,而存储在 m_resultWasSet 中的信息可以存储在基本类型的上述状态标识中。

结果创建 Task所需的时间会减少 49-55%,对象的大小会减少 52%。

Task.WaitAll, Task.WaitAny

试想一下,我们需要同时等待十亿个任务。在一台 x64 的计算机上,这会导致 12,000,000 比特的负载,这还没有计算任务本身。如果使用.NET 4.5,负载会降到仅仅 64 比特。同时 WaitAny 的负载也会从 23,200,000 比特降到 152 比特。

之所以出现如此戏剧化的效果,是因为微软改变了使用核心同步基元(kernel synchronization primitives)的方式。在之前的版本中,每个任务都需要一个基元(primitive )。现在已经大大减少,每个等待操作只需要一个基元,与操作中的任务数量无关。

ConcurrentDictionary

在.NET 中,只有引用类型和很小的值类型才能够以原子的方式赋值。较大的值类型——像 Guid——则无法以原子的方式读写。在.NET 4.0 中,为了解决这个问题,ConcurrentDictionary 会使用 node 对象,每次与键值关联的值发生改变的时候,都会重新创建这个对象。在.NET 4.5 中,只有在无法以原子的方式对值进行写操作的时候,才会创建新的 node 对象。

另一项改变是我们可以动态地创建锁。 Igor Ostrovsky 写到

在实践中,为了达到最大吞吐量,往往需要大量锁。另一方面,我们又不希望分配太多锁对象,特别是在 ConcurrentDictionary 最后只存储了很少项目的时候。

想要提升性能,就要减少内存分配

Joseph 写到:

在我们的评测结果中你可以看到,在测试中分配的内存数量和完成测试所需的时间之间有直接关系。当我们单独查看的时候,内存分配并不是非常昂贵。但是,当内存系统只是偶尔清理不使用的内存时,问题就出现了,并且问题出现的频率和要分配的内存数量成正比。因此,你分配越多的内存,对内存进行垃圾回收的频率就越频繁,你的代码性能就会变得越差。

想要降低内存使用,一种方式就是避免使用闭包(closure)。不要在匿名的函数中捕获局部变量,我们可以把它传递给 Task 的构造函数,作为它的“状态(state)对象”。从.NET 4.5 开始,Task.ContinueWith 也会支持状态对象。

另一种减少内存使用的技术是缓存经常使用的任务。例如,假设一个函数会接受一个数组作为参数,并返回 Task。因为对于空数组结果总会是一样的,所以缓存代表空数组的 Task 就很合理。

下一个技巧是避免让任务不必要地“膨胀”。当某些代码触发了创建 ContingentProperties 的操作,Task 对象就会膨胀。最经常出现的原因包括:

  • 创建的任务带有 CancellationToken
  • 任务是从非默认的 ExecutionContext 创建的
  • Task 作为父 Task 参与到“结构化并行机制(structured parallelism)”中
  • Task 以 Faulted 状态结束
  • Task 通过 ((IAsyncResult)Task).AsyncWaitHandle.Wait() 处于等待状态

大家还要记住,任务膨胀并不一定是坏事。它只是需要注意的问题,这样我们就不会做不需要的事情,像传入从来不会用到的 CancellationToken 等。

查看英文原文: Task Parallel Library Improvements in .NET 4.5

2011-12-08 01:043319
用户头像

发布了 340 篇内容, 共 133.1 次阅读, 收获喜欢 13 次。

关注

评论

发布
暂无评论
发现更多内容

原创 面试官:你说对MySQL事务很熟?那我问你10个问题

程序员柠檬

MySQL 数据库

2020年南京第十三届物联网应用展览会

南京专业智博会

展览会 论坛会 博览会 智博会

2020年亚洲南京大数据产业展览会

南京专业智博会

展览会 论坛会 博览会 智博会

如何优雅地实现泛型类的类型参数化

KAMI

Java 编程 反射 泛型

10分钟白嫖我的常用的在线工具网站清单

JavaGuide

设计 在线工具 工具类网站 PDF

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (十二)编写测试-简单测试

编程道与术

Java 编程 TDD 单元测试 JUnit

github看代码效率提高10倍!因为用了sourcegraph这个工具

程序员柠檬

GitHub 程序员 效率工具

你真的清楚 Nginx 指令的规则吗?

子杨

nginx 运维

这可能是 Markdown 写微信公众号的一款神器了!

JackTian

效率工具 markdown markdown编辑器 markdownnice 神器

分布式锁🔒是个啥❓ 其实就这么点事

山中兰花草

Java redis 后端 分布式锁 开发

游戏夜读 | 记忆里的老游戏

game1night

Java 底层基础笔记(一)硬件

奈何花开

Java Linux 计算机基础

k6新崛起的性能测试工具

风中之心

DevOps 性能 性能测试

2020年南京第十三届智慧停车展会

南京专业智博会

展览会 博览会 智博会 展览会论坛会

面试造飞机系列:说下微服务接口设计原则?

程序员柠檬

分布式 微服务 后端 架构设计

不忘初心,继续努力

一周思进

ARTS 打卡计划

ARTS打卡-01

Geek_yansheng25

ARTS 打卡计划

PageHelper

BitSea

使用 PCA 进行降维可视化,了解特征分布

黄大路

数据挖掘 数据分析 可视化

思维模型 - 概念篇

石云升

学习 高效 思维模型 决策

Linux下程序出问题不要慌,资深程序员教你6招搞定!

程序员柠檬

Linux 程序员 后台开发

2020亚洲南京第十三届人工智能机器人服务展览会

南京专业智博会

展览会 论坛会 博览会 智博会

Jupyter最佳实践

pydata

如何衡量产品需求效果

黄大路

产品经理 产品设计 运营

2020亚洲智能家居全屋智能展会-南京站

南京专业智博会

展览会 论坛会 博览会 智博会

ARTS-week-1

saddamwilson

ARTS 打卡计划

推荐几款有意思的小众App(05.30)

静陌

产品 App

Wireshark的使用与数据分析(一)

姬翔

用大数据分析了一线城市1000多份岗位招聘需求,告诉你如何科学找工作

程序员柠檬

Python 数据分析

2020南京第十三届智慧工地装备展览会

南京专业智博会

展览会 论坛会 博览会 智博会

Markdown 几行字符就可以生成思维导图了!

JackTian

markdown 思维导图 markdown语法 markdown编辑器 Markmap

.NET 4.5中任务并行类库的改进_.NET_Jonathan Allen_InfoQ精选文章