当咱们谈到性能优化,更多的同窗可能想到的是系统层面的性能优化。好比在一个Web服务程序中,经过Redis或者其它缓存来提高网站访问的速度等。这一方面是编译器为咱们作了不少优化工做,另一方面是以为系统层面的优化效果更明显,也更高大上。实际上,除了系统层面的性能优化外,在程序代码层面的性能优化效果也是很是好的。 废话很少说,咱们以事实说话。你们看一下下面两段程序,两段程序的做用彻底相同,就是将一个二维数组中的每个元素作加1操做。你们看一下,以为这两段的程序是否会有性能差别?实际测试结果是二者有近4倍的性能差别。java
// 这是第一段程序
for(i = 0; i < 1024; i ++)
for(j = 0; j < 1024; j ++)
array[j][i] ++;
//程序的差别在这里 ^ ^
//这是第二段程序
for(i = 0; i < 1024; i ++)
for(j = 0; j < 1024; j ++)
array[i][j] ++;
复制代码
你们考虑一下,为何有如此之大的性能差别?结合代码,咱们看到两段代码的差别在于对数组元素的访问顺序,前者是逐列访问,然后者是逐行访问。结合图1可能会理解的更加清楚一些。而后,咱们在结合C语言中二维数据数据在内存中的排布规则(能够在上述代码中经过打印地址的方式验证一下),能够知道前者是访问连续的地址空间,然后者访问的是跳跃的地址空间。 数组
空间局部性:对于刚被访问的数据,其相邻的数据在未来被访问的几率高。 时间局部性:对于刚被访问的数据,其自己在未来被访问的几率高。缓存
了解了上述原理,咱们就知道,对于上面程序程序代码,因为第二段程序依次跳跃的太远,也就是不知足空间局部性,从而致使缓存命中失败。也就是说第二段程序其实没法访问缓存中的数据,而是直接访问的内存。而内存的访问性能要远远低于缓存的访问性能,所以就出现了文章一开始的近4倍的性能差别。性能优化
咱们程序的很微小的改动就有可能对性能产生很是大的影响。所以,咱们在平常开发中应该到处注意代码中是否有不恰当的代码致使性能问题。下面咱们在列举一个关于性能相关的程序实例,以便你们在之后的开发中参考。架构
不合理的程序结构对性能的影响有的时候是灾难性的。下面两个函数的性能差别在字符串很长的状况下将很是巨大。函数lower1
在每次循环中都计算一下字符串的长度,而这种计算并非必要的。函数lower2
则是在循环开始以前计算字符串长度,然后经过一个恒定的变量来进行条件判断。问题的根源在于strlen函数,这个函数经过循环计算字符串的长度,若是字符串比较长,那这个函数将至关耗时。分布式
void lower1(char *s) {
int i;
for (i = 0; i < strlen(s); i++)
if (s[i] >='A' && s[i] <= 'Z')
s[i] -= ('A' -'a');
}
//下面这个实现性能会更好。
void lower2(char *s) {
int i;
int len = strlen(s);
for (i = 0; i < len; i++)
if (s[i] >='A' && s[i] <= 'Z')
s[i] -= ('A' -'a');
}
复制代码
咱们知道在过程调用的时候会存在压栈和出栈等操做,这些操做一般都是对内存的操做,且过程比较复杂。也就是说,函数的调用过程是比较耗时的操做,尽可能减小函数调用。 值得庆幸的是现代的编译器能够对函数调用作不少优化工做,简单的函数调用一般能够被编译器优化调。所谓优化调是只在机器语言(汇编语言)层面已经没有高级语言的函数调用了。 咱们经过一个具体的例子看一下,经过C语言实现一个简单的函数调用,其中函数fun_1调用函数fun_2,而函数fun_2又调用了printf。这里fun_2并无作什么太多的工做,只是将两个参数相加后传给printf。 函数
不一样的运算的耗时差别也是很是巨大的,好比乘法的耗时是加法的两三倍,而除法的耗时是加法的十倍以上。所以在访问频度比较高的逻辑中减小除法的使用将会明显的提高。 在Java的HashMap实现中,经过位运算来计算哈希的Key,而不是经过模运算。由于模运算自己是除法运算,性能要比位运算差十倍以上。性能
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
复制代码
更详细的处理逻辑请参考JDK的源代码,本文仅仅是抛个砖 。测试
支持类的高级语言在传递对象参数的时候涉及拷贝的过程,对象的拷贝也是比较消耗性能的操做。固然,高级语言经过一种成为引用的机制实现了对象地址的传递,这样就避免了拷贝的过程(这就是传值与传址的差别)。 在程序开发过程当中关于性能的问题还不少,本文没法一一列举出来。但,关键的问题是掌握技术的底层实现原理,任何其它高层的内容均可以经过底层原理解释的,正所谓万变不离其宗。优化