小师妹学JVM之:cache line对代码性能的影响

时间 2020-07-10

标签师妹 jvm cache line 代码性能影响栏目 Java 繁體版

原文原文链接

简介

读万卷书不如行万里路，讲了这么多assembly和JVM的原理与优化，今天咱们来点不同的实战。探索一下怎么使用assembly来理解咱们以前不能理解的问题。java

一个奇怪的现象

小师妹:F师兄，以前你讲了那么多JVM中JIT在编译中的性能优化，讲真的，在工做中咱们真的须要知道这些东西吗？知道这些东西对咱们的工做有什么好处吗？git

um...这个问题问得好，知道了JIT的编译原理和优化方向，咱们的确能够在写代码的时候稍微注意一下，写出性能更加优秀的代码，可是这只是微观上了。程序员

若是将代码上升到企业级应用，一个硬件的提高，一个缓存的加入或者一种架构的改变均可能比小小的代码优化要有用得多。github

就像是，若是咱们的项目遇到了性能问题，咱们第一反应是去找架构上面有没有什么缺陷，有没有什么优化点，不多或者说基本上不会去深刻到代码层面，看你的这个代码到底有没有可优化空间。算法

第一，只要代码的业务逻辑不差，运行起来速度也不会太慢。spring

第二，代码的优化带来的收益实在过小了，而工做量又很是庞大。缓存

因此说，对于这种相似于鸡肋的优化，真的有必要存在吗？性能优化

其实这和我学习物理化学数学知识是同样的，你学了那么多知识，其实在平常生活中真的用不到。可是为何要学习呢？架构

我以为有两个缘由，第一是让你对这个世界有更加本质的认识，知道这个世界是怎么运行的。第二是锻炼本身的思惟习惯，学会解决问题的方法。jvm

就想算法，如今写个程序真的须要用到算法吗？不见得，可是算法真的很重要，由于它能够影响你的思惟习惯。

因此，了解JVM的原理，甚至是Assembly的使用，并非要你用他们来让你的代码优化的如何好，而是让你知道，哦，原来代码是这样工做的。在将来的某一个，或许我就可能用到。

好了，言归正传。今天给小师妹介绍一个很奇怪的例子：

private static int[] array = new int[64 * 1024 * 1024];

    @Benchmark
    public void test1() {
        int length = array.length;
        for (int i = 0; i < length; i=i+1)
            array[i] ++;
    }
    @Benchmark
    public void test2() {
        int length = array.length;
        for (int i = 0; i < length; i=i+2)
            array[i] ++;
    }

小师妹，上面的例子，你以为哪个运行的更快呢？

小师妹：固然是第二个啦，第二个每次加2，遍历的次数更少，确定执行得更快。

好，咱们先持保留意见。

第二个例子，上面咱们是分别+1和+2，若是后面再继续+3，+4，一直加到128，你以为运行时间是怎么样的呢？

小师妹：确定是线性减小的。

好，两个问题问完了，接下来让咱们来揭晓答案吧。

更多精彩内容且看：

两个问题的答案

咱们再次使用JMH来测试咱们的代码。代码很长，这里就不列出来了，有兴趣的朋友能够到本文下面的代码连接下载运行代码。

咱们直接上运行结果：

Benchmark               Mode  Cnt   Score   Error  Units
CachelineUsage.test1    avgt    5  27.499 ± 4.538  ms/op
CachelineUsage.test2    avgt    5  31.062 ± 1.697  ms/op
CachelineUsage.test3    avgt    5  27.187 ± 1.530  ms/op
CachelineUsage.test4    avgt    5  25.719 ± 1.051  ms/op
CachelineUsage.test8    avgt    5  25.945 ± 1.053  ms/op
CachelineUsage.test16   avgt    5  28.804 ± 0.772  ms/op
CachelineUsage.test32   avgt    5  21.191 ± 6.582  ms/op
CachelineUsage.test64   avgt    5  13.554 ± 1.981  ms/op
CachelineUsage.test128  avgt    5   7.813 ± 0.302  ms/op

好吧，不够直观，咱们用一个图表来表示：