在.NET 平台里,大部分编译器的优化并不是通过 VB 和 C#编译器来完成的。它们宁可把优化的处理推后到 CLR 的即时(Just In Time,JIT)编译器读取 IL,并转换为原生机器码的时候来完成。由于这个原因,对 JIT 的改变会极大地影响之前编译好的程序集。
一个主要的影响就是内联函数(Inlining Function)调用。之前,JIT 对内联方法的处理非常保守, Vance Morrison 解释了个中缘由,
它对内联的处理并不是很好。内联总是减少指令执行的数量(这是由于最低限度的调用和返回指令没有被执行),但是它能(并经常)让结果代码变得很大。大部分人都能直觉地理解,内联大的方法(比如 1Kb 的)不是很有意义,而内联非常小的方法可以让调用的占用空间更小(由于调用指令才 5 字节),这样的选择总是正确的,但是介于两者之间的方法要如何处理呢?有趣的是,当你让代码变大时,你也就让它执行缓慢,因为内存天生地缓慢;你的代码越大,它越不会放在最快的 CPU 缓存(称之为 L1)里面执行,在那样的情况下,处理器需要执行 3-10 个周期直到它能从另外的缓存(称之为 L2)中获取到执行代码,如果 L2 缓存中还不存在,那么就需要到主内存中获取(需要花费 10+ 周期)。对于在紧密循环中执行的代码,这样的结果不会有什么问题,因为所有的代码都适合放入到最快缓存中(典型的是 64K),不过对于“常规的”代码,它通过大量的方法来执行大量的代码,“越大就越慢”的效果就非常显著。更大的代码也就意味着在启动时从磁盘获取代码需要更大的磁盘 I/O,这就意味着你的应用程序启动较慢。
在 Service Pack 1 中,微软引入了一个新的基于代码尺寸的启发式算法,来判断调用是否处于一个循环中。在常规情况下,函数只有当在调用空间中的结果机器码比原始版本要小时,才能被内联。这样做就保证了尽可能多的代码能适合 CPU 的缓存,当缓存不够用时,就能对性能产生巨大的影响。
当处在循环中时,分部异常也可以很好地工作。这是因为据推测函数通常会被多次调用,所以 CLR 允许内联函数可以增长至原始调用大小的 5 倍大。类似值类型优化这样的条件有可能更进一步地增加容许尺寸的大小。
查看英文原文: In Case You Missed It: JIT Enhancements in .NET 3.5 SP1
评论