1.编译器优化介绍:linux
因为内存访问速度远不及CPU处理速度,为提升机器总体性能,在硬件上引入硬件高速缓存Cache,加速对内存的访问。另外在现代CPU中指令的执行并不必定严格按照顺序执行,没有相关性的指令能够乱序执行,以充分利用CPU的指令流水线,提升执行速度。以上是硬件级别的优化。再看软件一级的优化:一种是在编写代码时由程序员优化,另外一种是由编译器进行优化。编译器优化经常使用的方法有:将内存变量缓存到寄存器;调整指令顺序充分利用CPU指令流水线,常见的是从新排序读写指令。对常规内存进行优化的时候,这些优化是透明的,并且效率很好。由编译器优化或者硬件从新排序引发的问题的解决办法是在从硬件(或者其余处理器)的角度看必须以特定顺序执行的操做之间设置内存屏障(memory barrier),Linux 提供了一个宏解决编译器的执行顺序问题。程序员
void Barrier(void)缓存
这个函数通知编译器插入一个内存屏障,但对硬件无效,编译后的代码会把当前CPU寄存器中的全部修改过的数值存入内存,须要这些数据的时候再从新从内存中读出。函数
2.volatile老是与优化有关,编译器有一种技术叫作数据流分析,分析程序中的变量在哪里赋值、在哪里使用、在哪里失效,分析结果能够用于常量合并,常量传播等优化,进一步能够消除一些代码。但有时这些优化不是程序所须要的,这时能够用volatile关键字禁止作这些优化。性能
1.volatile的本意是“易变的” 由于访问寄存器要比访问内存单元快的多,因此编译器通常都会做减小存取内存的优化,但有可能会读脏数据。当要求使用volatile声明变量值的时候,系统老是从新从它所在的内存读取数据,即便它前面的指令刚刚从该处读取过数据。精确地说就是,遇到这个关键字声明的变量,编译器对访问该变量的代码就再也不进行优化,从而能够提供对特殊地址的稳定访问;若是不使用valatile,则编译器将对所声明的语句进行优化。(简洁的说就是:volatile关键词影响编译器编译的结果,用volatile声明的变量表示该变量随时可能发生变化,与该变量有关的运算,不要进行编译优化,以避免出错)优化
2.看两个事例:spa
1>告诉compiler不能作任何优化.net
好比要往某一地址送两指令:
int *ip =...; //设备地址
*ip = 1; //第一个指令
*ip = 2; //第二个指令
以上程序compiler可能作优化而成:
int *ip = ...;
*ip = 2;
结果第一个指令丢失。若是用volatile, compiler就不容许作任何的优化,从而保证程序的原意:
volatile int *ip = ...;
*ip = 1;
*ip = 2;
即便你要compiler作优化,它也不会把两次付值语句间化为一。它只能作其它的优化。线程
2>用volatile定义的变量会在程序外被改变,每次都必须从内存中读取,而不能重复使用放在cache或寄存器中的备份。设计
例如:
volatile char a; a=0; while(!a){ //do some things; } doother();
若是没有 volatile doother()不会被执行
3.下面是使用volatile变量的几个场景:
1>中断服务程序中修改的供其它程序检测的变量须要加volatile;
例如:
static int i=0; int main(void) { ... while (1){ if (i) dosomething(); } } /* Interrupt service routine. */ void ISR_2(void) { i=1; }
程序的本意是但愿ISR_2中断产生时,在main函数中调用dosomething函数,可是,因为编译器判断在main函数里面没有修改过i,所以可能只执行一次对从i到某寄存器的读操做,而后每次if判断都只使用这个寄存器里面的“i副本”,致使dosomething永远也不会被调用。若是将变量加上volatile修饰,则编译器保证对此变量的读写操做都不会被优化(确定执行)。此例中i也应该如此说明。
2>多任务环境下各任务间共享的标志应该加volatile
3>存储器映射的硬件寄存器一般也要加voliate,由于每次对它的读写均可能有不一样意义。
例如:假设要对一个设备进行初始化,此设备的某一个寄存器为0xff800000。
int *output = (unsigned int *)0xff800000;//定义一个IO端口; int init(void) { int i; for(i=0;i< 10;i++){ *output = i; } }
通过编译器优化后,编译器认为前面循环半天都是废话,对最后的结果毫无影响,由于最终只是将output这个指针赋值为9,因此编译器最后给你编译编译的代码结果至关于:
int init(void) { *output = 9; }
若是你对此外部设备进行初始化的过程是必须是像上面代码同样顺序的对其赋值,显然优化过程并不能达到目的。反之若是你不是对此端口反复写操做,而是反复读操做,其结果是同样的,编译器在优化后,也许你的代码对此地址的读操做只作了一次。然而从代码角度看是没有任何问题的。这时候就该使用volatile通知编译器这个变量是一个不稳定的,在遇到此变量时候不要优化。
例如:
volatile int *output=(volatile unsigned int *)0xff800000;//定义一个I/O端口
另外,以上这几种状况常常还要同时考虑数据的完整性(相互关联的几个标志读了一半被打断了重写),在1中能够经过关中断来实现,2中禁止任务调度,3中则只能依靠硬件的良好设计。
4.几个问题
1)一个参数既能够是const还能够是volatile吗?
能够的,例如只读的状态寄存器。它是volatile由于它可能被意想不到地改变。它是const由于程序不该该试图去修改它。
2) 一个指针能够是volatile 吗?
能够,当一个中断服务子程序修该一个指向一个buffer的指针时。
5.volatile的本质:
1> 编译器的优化
在本次线程内, 当读取一个变量时,为提升存取速度,编译器优化时有时会先把变量读取到一个寄存器中;之后,再取变量值时,就直接从寄存器中取值;当变量值在本线程里改变时,会同时把变量的新值copy到该寄存器中,以便保持一致。
当变量在因别的线程等而改变了值,该寄存器的值不会相应改变,从而形成应用程序读取的值和实际的变量值不一致。
当该寄存器在因别的线程等而改变了值,原变量的值不会改变,从而形成应用程序读取的值和实际的变量值不一致。
2>volatile应该解释为“直接存取原始内存地址”比较合适,“易变的”这种解释简直有点误导人。
6.下面的函数有什么错误:
int square(volatile int *ptr) { return *ptr * *ptr; }
该程序的目的是用来返指针*ptr指向值的平方,可是,因为*ptr指向一个volatile型参数,编译器将产生相似下面的代码:
int square(volatile int *ptr) { int a,b; a = *ptr; b = *ptr; return a * b; }
因为*ptr的值可能被意想不到地该变,所以a和b多是不一样的。结果,这段代码可能返不是你所指望的平方值!正确的代码以下:
long square(volatile int *ptr) { int a; a = *ptr; return a * a; }
注意:频繁地使用volatile极可能会增长代码尺寸和下降性能,所以要合理的使用volatile。