(转)Android高性能编程(1)--基础篇

时间 2019-11-10

原文原文链接

关于专题
本专题将深刻研究Android的高性能编程方面，其中涉及到的内容会有Android内存优化，算法优化，Android的界面优化，Android指令级优化，以及Android应用内存占用分析，还有一些其余有关高性能编程的知识.
  随着技术的发展，智能手机硬件配置愈来愈高，但是它和如今的 PC 相比，其运算能力，续航能力，存储空间等都仍是受到很大的限制，同时用户对手机的体验要求远远高于 PC 的桌面应用程序。以上理由，足以须要开发人员更加专心去实现和优化你的代码了。选择合适的算法和数据结构永远是开发人员最早应该考虑的事情。同时，咱们应该时刻牢记，写出高效代码的两条基本的原则：（1）不要作没必要要的事；（2）不要分配没必要要的内存。
高效的代码由两点的来决定：1.高效的数据结构；2高效的执行算法。因此咱们在作应用性能优化的时候，要从各个方面考虑现有的数据结构是否适合当前的功能或者产品，还有就是现有的执行算法是否高效。

今天第一篇文章，主要给你们分享一些高性能编程的基础知识，其中结合了一些网友和官网的总结分析。
先推荐一本大神的书：Pro Android Apps Performance Optimization

  内存优化

  Android系统对每一个软件所能使用的RAM空间进行了限制（如：Nexus one 对每一个软件的内存限制是24M），同时 Java 语言自己比较消耗内存，dalvik 虚拟机也要占用必定的内存空间，因此合理使用内存，彰显出一个程序员的素质和技能。
   （1）了解 JIT
　　即时编译（Just-in-time Compilation，JIT），又称动态转译（Dynamic Translation），是一种经过在运行时将字节码翻译为机器码，从而改善字节码编译语言性能的技术。即时编译前期的两个运行时理论是字节码编译和动态编译。Android 原来 Dalvik 虚拟机是做为一种解释器实现，新版（Android 2.2+）将换成 JIT 编译器实现。性能测试显示，在多项测试中新版本比旧版本提高了大约 6 倍。
（2）避免建立没必要要的对象
　　就像世界上没有免费的午饭，世界上也没有免费的对象。虽然 gc 为每一个线程都创建了临时对象池，可使建立对象的代价变得小一些，可是分配内存永远都比不分配内存的代价大。若是你在用户界面循环中分配对象内存，就会引起周期性的垃圾回收，用户就会以为界面像打嗝同样一顿一顿的。因此，除非必要，应尽可能避免尽力对象的实例。下面的例子将帮助你理解这条原则：当你从用户输入的数据中截取一段字符串时，尽可能使用 substring 函数取得原始数据的一个子串，而不是为子串另外创建一份拷贝。这样你就有一个新的 String 对象，它与原始数据共享一个 char 数组。若是你有一个函数返回一个 String 对象，而你确切的知道这个字符串会被附加到一个 StringBuffer，那么，请改变这个函数的参数和实现方式，直接把结果附加到 StringBuffer 中，而不要再创建一个短命的临时对象。
　　一个更极端的例子是，把多维数组分红多个一维数组：
　　int 数组比 Integer 数组好，这也归纳了一个基本事实，两个平行的 int 数组比 (int,int) 对象数组性能要好不少。同理，这适用于全部基本类型的组合。若是你想用一种容器存储 (Foo,Bar) 元组，尝试使用两个单独的 Foo[] 数组和 Bar[] 数组，必定比 (Foo,Bar) 数组效率更高。（也有例外的状况，就是当你创建一个 API，让别人调用它的时候。这时候你要注重对 API 接口的设计而牺牲一点儿速度。固然在 API 的内部，你仍要尽量的提升代码的效率）
　　整体来讲，就是避免建立短命的临时对象。减小对象的建立就能减小垃圾收集，进而减小对用户体验的影响。
（3）静态方法代替虚拟方法
　　若是不须要访问某对象的字段，将方法设置为静态，调用会加速 15% 到 20%。这也是一种好的作法，由于你能够从方法声明中看出调用该方法不须要更新此对象的状态。从Smali指令级别来看，调用实例方法的指令时invoke-virtual 而调用静态方法的指令是invoke-static.两个指令的区别在于invoke-virtual须要多一个本地寄存器(用于存当前对象this)。后期会对smali指令集优化作详细的介绍
（4）避免内部 Getters/Setters
　　在源生语言像 C++ 中，一般作法是用 Getters(i=getCount()) 代替直接字段访问 (i=mCount)。这是 C++ 中一个好的习惯，由于编译器会内联这些访问，而且若是须要约束或者调试这些域的访问，你能够在任什么时候间添加代码。而在 Android 中，这不是一个好的作法。虚方法调用的代价比直接字段访问高昂许多。一般根据面向对象语言的实践，在公共接口中使用 Getters 和 Setters 是有道理的，但在一个字段常常被访问的类中宜采用直接访问。无 JIT 时，直接字段访问大约比调用 getter 访问快 3 倍。有 JIT 时（直接访问字段开销等同于局部变量访问），要快7倍。从Smali指令级别上来看，调用虚函数的指令时invoke-virtual，而直接访问类变量的指令时iget，从官网的介绍来看，就说明iget指令的执行效果要比invoke-virtual高不少.
（5）在屡次调用全局变量的函数里，将全局变量赋值给本地变量html

　　访问成员变量比访问本地变量慢得多，下面一段代码：java

[java] view plain copy

for(int i =0; i <this.mCount; i++) {
dumpItem(this.mItems);
}

最好改为这样：android

[java] view plain copy

int count = this.mCount;

Item[] items = this.mItems;

for(int i =0; i < count; i++)  {

   dumpItems(items);

}

　　另外一个类似的原则是：永远不要在 for 的第二个条件中调用任何方法。以下面方法所示，在每次循环的时候都会调用 getCount() 方法，这样作比你在一个 int 先把结果保存起来开销大不少。程序员

[java] view plain copy

for(int i =0; i < this.getCount(); i++) {
dumpItems(this.getItem(i));
}

　　一样若是你要屡次访问一个变量，也最好先为它创建一个本地变量，例如：正则表达式

[java] view plain copy

public void useGlobalVariable() {

       mViewGroup.addStatesFromChildren();

    mViewGroup.bringToFront();

       mViewGroup.animate();

       mViewGroup.buildLayer();

   }

　　这里有 4 次访问成员变量 mViewGroup，若是将它缓存到本地，4 次成员变量访问就会变成 4 次效率更高的本地变量访问。
　　另外就是方法的参数与本地变量的效率相同。(传入参数和本地变量执行效果是相同的),在smli指令上来看，本地寄存器为v0,v1,v2... ,参数寄存器为p0,p1,p2
若是不想再函数内频繁申明本地变量，那最好将全局变量做为参数传入函数。和声明本地变量效率是同样的，甚至是更高。由于少了将全局变量赋给本地变量的指令执行。具体效率对比，后期慢慢来说。
性能优化
（1）对常量使用 static final 修饰符
　　让咱们来看看这两段在类前面的声明：算法

[java] view plain copy

static int intVal = 42;
static String strVal = "Hello, world!";
static String strVal = "Hello, world!";

必以其会生成一个叫作 clinit 的初始化类的方法，当类第一次被使用的时候这个方法会被执行。方法会将 42 赋给 intVal，而后把一个指向类中常量表的引用赋给 strVal。当之后要用到这些值的时候，会在成员变量表中查找到他们。下面咱们作些改进，使用“final”：

[java] view plain copy

static final int intVal = 42;

static final String strVal = "Hello, world!";

如今，类再也不须要 clinit 方法，由于在成员变量初始化的时候，会将常量直接保存到类文件中。用到 intVal 的代码被直接替换成 42，而使用 strVal 的会指向一个字符串常量，而不是使用成员变量。
　　将一个方法或类声明为 final 不会带来性能的提高，可是会帮助编译器优化代码。举例说，若是编译器知道一个 getter 方法不会被重载，那么编译器会对其采用内联调用。
　　你也能够将本地变量声明为 final，一样，这也不会带来性能的提高。使用“final”只能使本地变量看起来更清晰些（可是也有些时候这是必须的，好比在使用匿名内部类的时候）。看看编译后的smali文件
.field static intVal:I = 0x0
.field static strVal:Ljava/lang/String;
以上两个指令是未声明final的。咱们能够发现，在编译以后，两个变量都是初始化值，并无赋给在Java文件中声明的值，这就说明这些值只有在类文件被使用的时候，执行clinit的时候，才会进行赋值
.field static final sintVal:I = 0x1a6
.field static final sstrVal:Ljava/lang/String; = "Hello, world!"
而这两个指令是声明了final的指令，咱们能够发现，编译完成以后，这两个变量已经具备了声明的值，这就说明不须要Java文件执行clinit，而这两个变量已经有了值，咱们称之为常量。

（2）使用改进的 For 循环语法编程

　　改进 for 循环（有时被称为 for-each 循环）可以用于实现了 iterable 接口的集合类及数组中。在集合类中，迭代器让接口调用 hasNext() 和 next() 方法。在 ArrayList 中，手写的计数循环迭代要快 3 倍（不管有没有JIT），但其余集合类中，改进的 for 循环语法和迭代器具备相同的效率。下面展现集中访问数组的方法：数组

[java] view plain copy

static class Foo {
int mSplat;
}
Foo[] mArray = ...
public void zero() {
int sum = 0;
for (int i = 0; i < mArray.length; ++i) {
sum += mArray[i].mSplat;
}
}
public void one() {
int sum = 0;
Foo[] localArray = mArray;
int len = localArray.length;
for (int i = 0; i < len; ++i) {
sum += localArray[i].mSplat;
}
}
public void two() {
int sum = 0;
for (Foo a : mArray) {
sum += a.mSplat;
}
}
}

　　在 zero() 中，每次循环都会访问两次静态成员变量，取得一次数组的长度。
　　在 one() 中，将全部成员变量存储到本地变量。
　　two() 使用了在 Java1.5 中引入的 foreach 语法。编译器会将对数组的引用和数组的长度保存到本地变量中，这对访问数组元素很是好。可是编译器还会在每次循环中产生一个额外的对本地变量的存储操做（对变量 a 的存取）这样会比 one() 多出 4 个字节，速度要稍微慢一些。
使用foreach方法循环效率是很高，可是在并发的环境下，颇有可能引发concurrentModifyException。

（3）避免使用浮点数
　　一般的经验是，在 Android 设备中，浮点数会比整型慢两倍，在缺乏 FPU 和 JIT 的 G1 上对比有 FPU 和 JIT 的 Nexus One 中确实如此（两种设备间算术运算的绝对速度差大约是 10 倍）从速度方面说，在现代硬件上，float 和 double 之间没有任何不一样。更普遍的讲，double 大 2 倍。在台式机上，因为不存在空间问题，double 的优先级高于 float。但即便是整型，有的芯片拥有硬件乘法，却缺乏除法。这种状况下，整型除法和求模运算是经过软件实现的，就像当你设计 Hash 表，或是作大量的算术那样，例如 a/2 能够换成 a*0.5。

（4）了解并使用类库
　　选择 Library 中的代码而非本身重写，除了一般的那些缘由外，考虑到系统空闲时会用汇编代码调用来替代 library 方法，这可能比 JIT 中生成的等价的最好的 Java 代码还要好。
i. 当你在处理字串的时候，不要吝惜使用 String.indexOf()，String.lastIndexOf() 等特殊实现的方法。这些方法都是使用 C/C++ 实现的，比起 Java 循环快 10 到 100 倍。
ii. System.arraycopy 方法在有 JIT 的 Nexus One 上，自行编码的循环快 9 倍。
iii. android.text.format 包下的 Formatter 类，提供了 IP 地址转换、文件大小转换等方法；DateFormat 类，提供了各类时间转换，都是很是高效的方法。
　　　　　详细请参考 http://developer.android.com/reference/android/text/format/package-summary.html
iv. TextUtils 类
　　　　　对于字符串处理 Android 为咱们提供了一个简单实用的 TextUtils 类，若是处理比较简单的内容不用去思考正则表达式不妨试试这个在 android.text.TextUtils 的类，详细请参考http://developer.android.com/reference/android/text/TextUtils.html
v. 高性能MemoryFile类。
　　不少人抱怨 Android 处理底层 I/O 性能不是很理想，若是不想使用 NDK 则能够经过 MemoryFile 类实现高性能的文件读写操做。MemoryFile 适用于哪些地方呢？对于 I/O 须要频繁操做的，主要是和外部存储相关的 I/O 操做，MemoryFile 经过将 NAND 或 SD 卡上的文件，分段映射到内存中进行修改处理，这样就用高速的 RAM 代替了 ROM 或 SD 卡，性能天然提升很多，对于 Android 手机而言同时还减小了电量消耗。该类实现的功能不是不少，直接从 Object 上继承，经过 JNI 的方式直接在 C 底层执行。
详细请参考 http://developer.android.com/reference/android/os/MemoryFile.html
在此，只简单列举几个经常使用的类和方法，更多的是要靠平时的积累和发现。多阅读 Google 给的帮助文档时颇有益的。
（5）合理利用本地方法
　　本地方法并非必定比 Java 高效。最起码，Java 和 native 之间过渡的关联是有消耗的，而 JIT 并不能对此进行优化。当你分配本地资源时（本地堆上的内存，文件说明符等），每每很难实时的回收这些资源。同时你也须要在各类结构中编译你的代码（而非依赖 JIT）。甚至可能须要针对相同的架构来编译出不一样的版本：针对 ARM 处理器的 GI 编译的本地代码，并不能充分利用 Nexus One 上的 ARM，而针对 Nexus One 上 ARM 编译的本地代码不能在 G1 的 ARM 上运行。当你想部署程序到存在本地代码库的 Android 平台上时，本地代码才显得尤其有用，而并不是为了 Java 应用程序的提速。
（6）复杂算法尽可能用 C 完成
　　复杂算法尽可能用 C 或者 C++ 完成，而后用 JNI 调用。可是若是是算法比较单间，没必要这么麻烦，毕竟 JNI 调用也会花必定的时间。请权衡。
（7）减小没必要要的全局变量
　　尽可能避免 static 成员变量引用资源耗费过多的实例，好比 Context ，避免内存泄露(后面针对内存泄露会有详细介绍)。Android 提供了很健全的消息传递机制 (Intent) 和任务模型 (Handler)，能够经过传递或事件的方式，防止一些没必要要的全局变量。
（8）不要过多期望 GC
　　Java 的 gc 使用的是一个有向图，判断一个对象是否有效看的是其余的对象能到达这个对象的顶点，有向图的相对于链表、二叉树来讲开销是可想而知。因此不要过多期望 gc。将不用的对象能够把它指向 NULL，并注意代码质量。同时，显示让系统 gc 回收，例如图片处理时，缓存

if(bitmap.isRecycled()==false) {

bitmap.recycle();

}

（9）了解 Java 四种引用方式
　　JDK 1.2 版本开始，把对象的引用分为 4 种级别，从而使程序能更加灵活地控制对象的生命周期。这 4 种级别由高到低依次为：强引用、软引用、弱引用和虚引用。
　　i.    强引用（StrongReference）
　　强引用是使用最广泛的引用。若是一个对象具备强引用，那垃圾回收器毫不会回收它。当内存空间不足，Java 虚拟机宁愿抛出 OutOfMemoryError 错误，使程序异常终止，也不会靠随意回收具备强引用的对象来解决内存不足的问题。
　　ii.    软引用（SoftReference）
　　若是一个对象只具备软引用，则内存空间足够，垃圾回收器就不会回收它；若是内存空间不足了，就会回收这些对象的内存。只要垃圾回收器没有回收它，该对象就能够被程序使用。软引用可用来实现内存敏感的高速缓存。
　　iii.    弱引用（WeakReference）
　　在垃圾回收器线程扫描它所管辖的内存区域的过程当中，一旦发现了只具备弱引用的对象，无论当前内存空间足够与否，都会回收它的内存。不过，因为垃圾回收器是一个优先级很低的线程，所以不必定会很快发现那些只具备弱引用的对象。
　　iv.    虚引用（PhantomReference）
　　顾名思义，就是形同虚设。与其余几种引用都不一样，虚引用并不会决定对象的生命周期。若是一个对象仅持有虚引用，那么它就和没有任何引用同样，在任什么时候候均可能被垃圾回收器回收。了解并熟练掌握这 4 中引用方式，选择合适的对象应用方式，对内存的回收是颇有帮助的。
　
（10）使用实体类比接口好
假设你有一个 HashMap 对象，你能够将它声明为 HashMap 或者 Map：
Map map1 = new HashMap();
HashMap map2 = new HashMap();
哪一个更好呢？
按照传统的观点 Map 会更好些，由于这样你能够改变他的具体实现类，只要这个类继承自 Map 接口。传统的观点对于传统的程序是正确的，可是它并不适合嵌入式系统，由于这涉及到一个上下转型的问题。调用一个接口的引用会比调用实体类的引用多花费一倍的时间。若是 HashMap 彻底适合你的程序，那么使用 Map 就没有什么价值。若是有些地方你不能肯定，先避免使用 Map，剩下的交给 IDE 提供的重构功能好了。（固然公共 API 是一个例外：一个好的 API 经常会牺牲一些性能）
（11）避免使用枚举
枚举变量很是方便，但不幸的是它会牺牲执行的速度和并大幅增长文件体积。例如：
public class Foo {
public enum Shrubbery { GROUND, CRAWLING, HANGING }
}

会产生一个900字节的.class文件(Foo$Shubbery.class)。在它被首次调用时，这个类会调用初始化方法来准备每一个枚举变量。每一个枚举项都会被声明成一个静态变量，并被赋值。而后将这些静态变量放在一个名为”$VALUES”的静态数组变量中。而这么一大堆代码，仅仅是为了使用三个整数。
这样：Shrubbery shrub =Shrubbery.GROUND；会引发一个对静态变量的引用，若是这个静态变量是 final int，那么编译器会直接内联这个常数。
一方面说，使用枚举变量可让你的 API 更出色，并能提供编译时的检查。因此在一般的时候你毫无疑问应该为公共 API 选择枚举变量。可是当性能方面有所限制的时候，你就应该避免这种作法了。性能优化

有些状况下，使用 ordinal() 方法获取枚举变量的整数值会更好一些，举例来讲：

[java] view plain copy

for(int n =0; n < list.size(); n++) {
if(list.items[n].e == MyEnum.VAL_X) {
// do something
} else if(list.items[n].e == MyEnum.VAL_Y) {
// do something
}
}

替换为：

[java] view plain copy

int valX = MyEnum.VAL_X.ordinal();
int valY = MyEnum.VAL_Y.ordinal();
int count = list.size();
MyItem items = list.items();
for(int n =0; n < count; n++) {
intvalItem = items[n].e.ordinal();
if(valItem == valX) {
// do something
} else if(valItem == valY) {
// do something
}
}

会使性能获得一些改善，但这并非最终的解决之道。

（12）将与内部类一同使用的变量声明在包范围内

请看下面的类定义：

[java] view plain copy

public class Foo {
private class Inner {
void stuff() {
Foo.this.doStuff(Foo.this.mValue);
}
}
private int mValue;
public void run() {
Inner in = new Inner();
mValue = 27;
in.stuff();
}
private void doStuff(int value) {
System.out.println("Value is " + value);
}
}

这其中的关键是，咱们定义了一个内部类(Foo$Inner)，它须要访问外部类的私有域变量和函数。这是合法的，而且会打印出咱们但愿的结果 Value is 27。问题是在技术上来说（在幕后）Foo$Inner 是一个彻底独立的类，它要直接访问 Foo 的私有成员是非法的。要跨越这个鸿沟，编译器须要生成一组方法：

/*package*/ static int Foo.access$100(Foo foo) {
/*package*/ static void Foo.access$200(Foo foo, int value) {
}
内部类在每次访问 mValue 和 doStuff 方法时，都会调用这些静态方法。就是说，上面的代码说明了一个问题，你是在经过接口方法访问这些成员变量和函数而不是直接调用它们。在前面咱们已经说过，使用接口方法（getter、 setter）比直接访问速度要慢。因此这个例子就是在特定语法下面产生的一个“隐性的”性能障碍。
经过将内部类访问的变量和函数声明由私有范围改成包范围，咱们能够避免这个问题。这样作能够让代码运行更快，而且避免产生额外的静态方法。（遗憾的是，这些域和方法能够被同一个包内的其余类直接访问，这与经典的 OO 原则相违背。所以当你设计公共 API 的时候应该谨慎使用这条优化原则）。

（13）缓存
适量使用缓存，不要过量使用，由于内存有限，能保存路径地址的就不要存放图片数据，不常用的尽可能不要缓存，不用时就清空。在一些比较耗时的算法，且执行会有若干次的地方，加入LruCache，后期会详细讲解缓存的使用和注意事项

（14）关闭资源对象

对 SQLiteOpenHelper，SQLiteDatabase，Cursor，文件，I/O 操做等都应该记得显示关闭。

好了，以上的一些内容都是在编写Android应用的时候，最基本须要注意的优化方面的知识。以后的文章，将会深刻讲解在Android应用开发中的各个方面的性能优化问题。

摘自：http://blog.csdn.net/litton_van/article/details/21702299