.NET 4.6中带来了一些与性能改进相关的CLR特性,这些特性中有一部分将会自动生效,而另一些特性,例如SIMD与异步本地存储(Async Local Storage)则须要对编写应用的方式进行某些改动。php
Mono团队一直以他们对SIMD,即单指令流多数据流特性的支持引觉得傲。SIMD是一种CPU指令集,它可以在同一时间对最多8个值进行同一操做。而随着.NET CLR版本4.6的推出,Windows开发者终于也可以使用这一特性了。html
为了实际观察一下SIMD的效果,能够参考一下这个示例。假设你须要经过c[i] = a[i] + b[i]这种形式对两个数组进行相加,以获得第三个数组。经过使用SIMD,你能够按照如下方式编写代码:web
for (int i = 0; i < size; i += Vector.Count) { Vector v = new Vector(A,i) + new Vector(B,i); v.CopyTo(C,i); }
请注意这个循环是如何按Vector<int>.Count的取值进行递增的,根据CPU类型的不一样,它的取值多是4或是8。.NET JIT编译器将根据CPU的不一样生成相应的代码,以4或8的值对数组进行批量相加。算法
这种方式看起来有些繁琐,所以微软还提供了一系列辅助类,包括:数组
恐怕大多数开发者都不知道这一点:.NET常常会对同一个程序集加载两次。发生这种状况的条件是.NET首先加载了某个程序集的IL版本,随后又加载了同一程序集的NGEN版本(即预编译版本)。这种方式对于物理内存来讲是至关严重的浪费,尤为是对诸如Visual Studio这样的大型32位应用程序来讲更为明显。缓存
而在.NET 4.6中,一旦CLR加载了某个程序集的NGEN版本,它会自动清空对应的IL版本所占用的内存。安全
早先咱们曾讨论过.NET 4.0中所引入的垃圾回收滞后时间模式,虽然这种方式比起让GC彻底中止一段时间的作法要可靠许多,但对于许多GC场景来讲,这种方式仍算不上完整。app
在.NET 4.6中,你将可以经过一种更精密的方式临时停止垃圾回收器的运做,新的TryStartNoGCRegion方法容许你指定在小对象以及大对象的堆中须要多少内存。异步
若是出现内存不足的状况,运行时将会返回false,或是中止运行,直到经过GC清理获得足够的内存为止。你能够经过为TryStartNoGCRegion传入某个标记的方式控制这一行为,若是你成功地进入了某个无GC区域(在过程结束前不容许进行GC),那么在过程结束时必须调用EndNoGCRegion方法。async
在官方文档中并无说明该方法是不是线程安全的,不过考虑到GC的工做原理,你应当尽可能避免让两个进程同时尝试改变GC状态的作法。
对于GC的另外一项改进是它处理pinned对象(即一旦分配后不可移动位置的对象)的方式。虽然在文档中对此方面的描述有些语焉不详,但当你固定了某个对象的位置时,一般也会固定其相邻对象的位置。Rich Lander在文中写道:
GC将以一种更优化的方式处理pinned对象,所以GC可以将pinned对象周围的内存进行更有效地压缩。对于大量使用pin方式的大规模应用来讲,这一改动将极大地改进应用的性能。
GC对于如何使用较早的几代中的内存方面也体现出更好的智能性,Rich继续写道:
第1代对象升级为第2代对象的方式也获得了改进,以更有效地使用内存。在为某一代分配新的内存空间以前,GC会先尝试使用可用的空间。同时,在利用可用空间区域建立对象时使用了新的算法,使新分配的空间大小比起从前更接近于对象的大小。
最后一项改进与性能并无直接的关系,但经过有效的利用仍然能达到优化的效果。在异步API尚未流行起来的年代,开发者能够利用线程本地存储(TLS)缓存信息。TLS对于某个特定的线程来讲就像是一种全局对象,这意味着你能够直接访问上下文信息并进行缓存,而无需显式地传递某种上下文对象。
而在async/await模式中,线程本地存储就变得毫无用武之地了。由于每次调用await的时候,都有可能跳转至另外一个线程。并且即使侥幸避开了这种状况,但其它代码也有可能跳转到你的线程中并干扰TLS中的信息。
新版本的.NET引入了异步本地存储(ALS)机制以解决这一问题,ALS在语义上等价于线程本地存储,但它可以随着await的调用进行相应的跳转。这一功能将经过AsyncLocal泛型类实现,其内部将调用CallContext对象用于保存数据。