深刻探索Android启动速度优化

时间 2020-04-10

原文原文链接

前言

成为一名优秀的Android开发，须要一份完备的知识体系，在这里，让咱们一块儿成长为本身所想的那样~。

在性能优化的整个知识体系中，最重要的就是稳定性优化，在上一篇文章《深刻探索Android稳定性优化》中咱们已经深刻探索了Android稳定性优化的疆域。那么，除了稳定性之外，对于性能纬度来讲，哪一个方面的性能是最重要的呢？毫无疑问，就是应用的启动速度。下面，就让咱们扬起航帆，一块儿来逐步深刻探索Android启动速度优化的奥秘。html

思惟导图大纲

1、启动优化的意义
2、应用启动流程
- 1 、应用启动的类型
- 二、冷启动分析及其优化方向
3、启动耗时检测
- 一、查看Logcat
- 二、adb shell
- 三、代码打点（函数插桩）
- 四、AOP(Aspect Oriented Programming) 打点
- 五、启动速度分析工具 — TraceView
- 六、启动速度分析工具 — Systrace
- 七、启动监控
4、启动优化常规方案
- 一、主题切换
- 二、第三方库懒加载
- 三、异步初始化预备知识-线程优化
- 四、异步初始化
- 五、延迟初始化
- 六、Multidex预加载优化
- 七、类预加载优化
- 八、WebView启动优化
- 九、页面数据预加载
- 十、启动阶段不启动子进程
- 十一、闪屏页与主页的绘制优化
5、启动优化黑科技
- 一、启动阶段抑制GC
- 二、CPU锁频
- 三、IO优化
- 四、数据重排
- 五、类加载优化（Dalvik）
- 六、保活
6、启动优化的常见问题
- 一、启动优化是怎么作的？
- 二、是怎么异步的，异步遇到问题没有？
- 三、启动优化有哪些容易忽略的注意点？
- 四、版本迭代致使的启动变慢有好的解决方式吗？
7、总结
- 一、优化总方针
- 二、注意事项

1、启动优化的意义

若是咱们去一家餐厅吃饭，在点餐的时候等了半天都没有服务人员过来，可能就没有耐心等待直接走了。java

对于App来讲，也是一样如此，若是用户点击App后，App半天都打不开，用户就可能失去耐心卸载应用。python

启动速度是用户对咱们App的第一体验，打开应用后才能去使用其中提供的强大功能，就算咱们应用的内部界面设计的再精美，功能再强大，若是启动速度过慢，用户第一印象就会不好。linux

所以，拯救App的启动速度，迫在眉睫。android

2、应用启动流程

1 、应用启动的类型

应用启动的类型总共分为以下三种：git

冷启动
热启动
温启动

下面，咱们来详细分析下各个启动类型的特色及流程。github

冷启动

从点击应用图标到UI界面彻底显示且用户可操做的所有过程。web

特色

耗时最多，衡量标准。算法

启动流程

Click Event -> IPC -> Process.start -> ActivityThread -> bindApplication -> LifeCycle -> ViewRootImplshell

首先，用户进行了一个点击操做，这个点击事件它会触发一个IPC的操做，以后便会执行到Process的start方法中，这个方法是用于进程建立的，接着，便会执行到ActivityThread的main方法，这个方法能够看作是咱们单个App进程的入口，至关于Java进程的main方法，在其中会执行消息循环的建立与主线程Handler的建立，建立完成以后，就会执行到 bindApplication 方法，在这里使用了反射去建立 Application以及调用了 Application相关的生命周期，Application结束以后，便会执行Activity的生命周期，在Activity生命周期结束以后，最后，就会执行到 ViewRootImpl，这时才会进行真正的一个页面的绘制。

热启动

直接从后台切换到前台。

特色

启动速度最快。

温启动

只会重走Activity的生命周期，而不会重走进程的建立，Application的建立与生命周期等。

特色

较快，介于冷启动和热启动之间的一个速度。

启动流程

LifeCycle -> ViewRootImpl

ViewRootImpl是什么？

它是GUI管理系统与GUI呈现系统之间的桥梁。每个ViewRootImpl关联一个Window， ViewRootImpl 最终会经过它的setView方法绑定Window所对应的View，并经过其performTraversals方法对View进行布局、测量和绘制。

二、冷启动分析及其优化方向

冷启动涉及的相关任务

冷启动以前

首先，会启动App
而后，加载空白Window
最后，建立进程

须要注意的是，这些都是系统的行为，通常状况下咱们是没法直接干预的。

随后任务

首先，建立Application
启动主线程
建立MainActivity
加载布局
布置屏幕
首帧绘制

一般到了界面首帧绘制完成后，咱们就能够认为启动已经结束了。

优化方向

咱们的优化方向就是 Application和Activity的生命周期 这个阶段，由于这个阶段的时机对于咱们来讲是可控的。

3、启动耗时检测

一、查看Logcat

在Android Studio Logcat中过滤关键字“Displayed”，能够看到对应的冷启动耗时日志。

二、adb shell

使用adb shell获取应用的启动时间

// 其中的AppstartActivity全路径能够省略前面的packageName
adb shell am start -W [packageName]/[AppstartActivity全路径]
复制代码

执行后会获得三个时间：ThisTime、TotalTime和WaitTime，详情以下：

ThisTime

表示最后一个Activity启动耗时。

TotalTime

表示全部Activity启动耗时。

WaitTime

表示AMS启动Activity的总耗时。

通常来讲，只需查看获得的TotalTime，即应用的启动时间，其包括 建立进程 + Application初始化 + Activity初始化到界面显示 的过程。

特色：

一、线下使用方便，不能带到线上。
二、非严谨、精确时间。

三、代码打点（函数插桩）

能够写一个统计耗时的工具类来记录整个过程的耗时状况。其中须要注意的有：

在上传数据到服务器时建议根据用户ID的尾号来抽样上报。
在项目中核心基类的关键回调函数和核心方法中加入打点。

其代码以下所示：

/**
* 耗时监视器对象，记录整个过程的耗时状况，能够用在不少须要统计的地方，好比Activity的启动耗时和Fragment的启动耗时。
*/
public class TimeMonitor {

    private final String TAG = TimeMonitor.class.getSimpleName();
    private int mMonitord = -1;
    
    // 保存一个耗时统计模块的各类耗时，tag对应某一个阶段的时间
    private HashMap<String, Long> mTimeTag = new HashMap<>();
    private long mStartTime = 0;

    public TimeMonitor(int mMonitorId) {
        Log.d(TAG, "init TimeMonitor id: " + mMonitorId);
        this.mMonitorId = mMonitorId;
    }

    public int getMonitorId() {
        return mMonitorId;
    }

    public void startMonitor() {
        // 每次从新启动都把前面的数据清除，避免统计错误的数据
        if (mTimeTag.size() > 0) {
        mTimeTag.clear();
        }
        mStartTime = System.currentTimeMillis();
    }

    /**
    * 每打一次点，记录某个tag的耗时
    */
    public void recordingTimeTag(String tag) {
        // 若保存过相同的tag，先清除
        if (mTimeTag.get(tag) != null) {
            mTimeTag.remove(tag);
        }
        long time = System.currentTimeMillis() - mStartTime;
        Log.d(TAG, tag + ": " + time);
        mTimeTag.put(tag, time);
    }

    public void end(String tag, boolean writeLog) {
        recordingTimeTag(tag);
        end(writeLog);
    }

    public void end(boolean writeLog) {
        if (writeLog) {
            //写入到本地文件
        }
    }

    public HashMap<String, Long> getTimeTags() {
        return mTimeTag;
    }
}
复制代码

为了使代码更好管理，咱们须要定义一个打点配置类，以下所示：

/**
* 打点配置类，用于统计各阶段的耗时，便于代码的维护和管理。
*/
public final class TimeMonitorConfig {

    // 应用启动耗时
    public static final int TIME_MONITOR_ID_APPLICATION_START = 1;
}
复制代码

此外，耗时统计可能会在多个模块和类中须要打点，因此须要一个单例类来管理各个耗时统计的数据：

/**
* 采用单例管理各个耗时统计的数据。
*/
public class TimeMonitorManager {

    private static TimeMonitorManager mTimeMonitorManager = null;
private HashMap<Integer, TimeMonitor> mTimeMonitorMap = null;

    public synchronized static TimeMonitorManager getInstance() {
        if (mTimeMonitorManager == null) {
            mTimeMonitorManager = new TimeMonitorManager();
        }
        return mTimeMonitorManager;
    }

    public TimeMonitorManager() {
        this.mTimeMonitorMap = new HashMap<Integer, TimeMonitor>();
    }

    /**
     * 初始化打点模块
    */
    public void resetTimeMonitor(int id) {
        if (mTimeMonitorMap.get(id) != null) {
            mTimeMonitorMap.remove(id);
        }
        getTimeMonitor(id).startMonitor();
    }

    /**
    * 获取打点器
    */
    public TimeMonitor getTimeMonitor(int id) {
        TimeMonitor monitor = mTimeMonitorMap.get(id);
        if (monitor == null) {
            monitor = new TimeMonitor(id);
            mTimeMonitorMap.put(id, monitor);
        }
        return monitor;
    }
}
复制代码

主要在如下几个方面须要打点：

应用程序的生命周期节点。
启动时须要初始化的重要方法，例如数据库初始化，读取本地的一些数据。
其余耗时的一些算法。

例如，启动时在Application和第一个Activity加入打点统计：

Application 打点

@Override
protected void attachBaseContext(Context base) {
    super.attachBaseContext(base);
    TimeMonitorManager.getInstance().resetTimeMonitor(TimeMonitorConfig.TIME_MONITOR_ID_APPLICATION_START);
}

@Override
public void onCreate() {
    super.onCreate();
    SoLoader.init(this, /* native exopackage */ false);
    TimeMonitorManager.getInstance().getTimeMonitor(TimeMonitorConfig.TIME_MONITOR_ID_APPLICATION_START).recordingTimeTag("Application-onCreate");
}
复制代码

第一个Activity打点

@Override
protected void onCreate(Bundle savedInstanceState) {
    TimeMonitorManager.getInstance().getTimeMonitor(TimeMonitorConfig.TIME_MONITOR_ID_APPLICATION_START).recordingTimeTag("SplashActivity-onCreate");
    super.onCreate(savedInstanceState);
    
    initData();
    
    TimeMonitorManager.getInstance().getTimeMonitor(TimeMonitorConfig.TIME_MONITOR_ID_APPLICATION_START).recordingTimeTag("SplashActivity-onCreate-Over");
}

@Override
protected void onStart() {
    super.onStart();
    TimeMonitorManager.getInstance().getTimeMonitor(TimeMonitorConfig.TIME_MONITOR_ID_APPLICATION_START).end("SplashActivity-onStart", false);
}
复制代码

特色

精确，可带到线上，可是代码有侵入性，修改为本高。

注意事项

一、在上传数据到服务器时建议根据用户ID的尾号来抽样上报。
二、onWindowFocusChanged只是首帧时间，App启动完成的结束点应该是真实数据展现出来的时候（一般来讲都是首帧数据），如列表第一条数据展现，记得使用getViewTreeObserver().addOnPreDrawListener()（在API 16以上能够使用addOnDrawListener），它会把任务延迟到列表显示后再执行，例如，在Awesome-WanAndroid项目的主页就有一个RecyclerView实现的列表，启动结束的时间就是列表的首帧时间，也即列表第一条数据展现的时候。这里，咱们直接在RecyclerView的适配器ArticleListAdapter的convert（onBindViewHolder）方法中加上以下代码便可：
```
if (helper.getLayoutPosition() == 1 && !mHasRecorded) {
      mHasRecorded = true;
      helper.getView(R.id.item_search_pager_group).getViewTreeObserver().addOnPreDrawListener(new ViewTreeObserver.OnPreDrawListener() {
          @Override
          public boolean onPreDraw() {
              helper.getView(R.id.item_search_pager_group).getViewTreeObserver().removeOnPreDrawListener(this);
              LogHelper.i("FeedShow");
              return true;
          }
      });
  }
复制代码
```

具体的实例代码可在这里查看。

为何不使用onWindowFocusChanged这个方法做为启动结束点？

由于用户看到真实的界面是须要有网络请求返回真实数据的，可是onWindowFocusChanged只是界面绘制的首帧时机，可是列表中的数据是须要从网络中下载获得的，因此应该以列表的首帧数据做为启动结束点。

四、AOP(Aspect Oriented Programming) 打点

面向切面编程，经过预编译和运行期动态代理实现程序功能统一维护的一种技术。

一、做用

利用AOP可以对业务逻辑的各个部分进行隔离，从而使得业务逻辑各部分之间的耦合性下降，提升程序的可重用性，同时大大提升了开发效率。

二、AOP核心概念

一、横切关注点

对哪些方法进行拦截，拦截后怎么处理。

二、切面（Aspect）

类是对物体特征的抽象，切面就是对横切关注点的抽象。

三、链接点（JoinPoint）

被拦截到的点（方法、字段、构造器）。

四、切入点（PointCut）

对JoinPoint进行拦截的定义。

五、通知（Advice）

拦截到JoinPoint后要执行的代码，分为前置、后置、环绕三种类型。

三、准备：接入AspectJx进行切面编码

首先，为了在Android使用AOP埋点须要引入AspectJ，在项目根目录的build.gradle下加入：

classpath 'com.hujiang.aspectjx:gradle-android-plugin- aspectjx:2.0.0'
复制代码

而后，在app目录下的build.gradle下加入：

apply plugin: 'android-aspectjx'
implement 'org.aspectj:aspectjrt:1.8.+'
复制代码

四、AOP埋点实战

JoinPoint通常定位在以下位置

一、函数调用
二、获取、设置变量
三、类初始化

使用PointCut对咱们指定的链接点进行拦截，经过Advice，就能够拦截到JoinPoint后要执行的代码。Advice一般有如下几种类型：

一、Before：PointCut以前执行
二、After：PointCut以后执行
三、Around：PointCut以前、以后分别执行

首先，咱们举一个小栗子：

@Before("execution(* android.app.Activity.on**(..))")
public void onActivityCalled(JoinPoint joinPoint) throws Throwable {
...
}
复制代码

在 execution 中的是一个匹配规则，第一个 * 表明匹配任意的方法返回值，后面的语法代码匹配全部Activity中on开头的方法。

其中execution是处理Join Point的类型，在AspectJx中共有两种类型，以下所示：

一、call：插入在函数体里面
二、execution：插入在函数体外面

如何统计Application中的全部方法耗时？

@Aspect
public class ApplicationAop {

    @Around("call (* com.json.chao.application.BaseApplication.**(..))")
    public void getTime(ProceedingJoinPoint joinPoint) {
    Signature signature = joinPoint.getSignature();
    String name = signature.toShortString();
    long time = System.currentTimeMillis();
    try {
        joinPoint.proceed();
    } catch (Throwable throwable) {
        throwable.printStackTrace();
    }
    Log.i(TAG, name + " cost" +     (System.currentTimeMillis() - time));
    }
}
复制代码

在上述代码中，咱们须要注意 不一样的Action类型其对应的方法入参是不一样的，具体的差别以下所示：

当Action为Before、After时，方法入参为JoinPoint。
当Action为Around时，方法入参为ProceedingPoint。

Around和Before、After的最大区别:

ProceedingPoint不一样于JoinPoint，其提供了proceed方法执行目标方法。

五、总结AOP特性

一、无侵入性
二、修改方便，建议使用

四、启动速度分析工具 — TraceView

一、使用方式

一、代码中添加：Debug.startMethodTracing()、检测方法、Debug.stopMethodTracing()。（须要使用adb pull将生成的.trace文件导出到电脑，而后使用Android Studio的Profiler进行加载）
二、打开 Profiler -> CPU -> 点击 Record -> 点击 Stop -> 查看Profiler下方Top Down/Bottom Up 区域，以找出耗时的热点方法。

二、Profile CPU

使用 Profile 的 CPU 模块能够帮咱们快速找到耗时的热点方法，下面，咱们来详细来分析一下这个模块。

一、Trace types

Trace types 有四种，以下所示。

一、Trace Java Methods

会记录每一个方法的时间、CPU信息。对运行时性能影响较大。

二、Sample Java Methods

相比于Trace Java Methods会记录每一个方法的时间、CPU信息，它会在应用的Java代码执行期间频繁捕获应用的调用堆栈，对运行时性能的影响比较小，可以记录更大的数据区域。

三、Sample C/C++ Functions

需部署到Android 8.0及以上设备，内部使用simpleperf跟踪应用的native代码，也能够命令行使用simpleperf。

四、Trace System Calls

检查应用与系统资源的交互状况。
查看全部核心的CPU瓶颈。
内部采用systrace，也能够使用systrace命令。

二、Event timeline

用于显示应用程序在其生命周期中转换不一样状态的活动，如用户交互、屏幕旋转事件等。

三、CPU timeline

用于显示应用程序 实时CPU使用率、其它进程实时CPU使用率、应用程序使用的线程总数。

四、Thread activity timeline

列出应用程序进程中的每一个线程，并使用了不一样的颜色在其时间轴上指示其活动。

绿色：线程处于活动状态或准备好使用CPU。
黄色：线程正等待IO操做。（重要）
灰色：线程正在睡眠，不消耗CPU时间。

五、检查跟踪数据窗口

Profile提供的检查跟踪数据窗口有四种，以下所示：

一、Call Chart

提供函数跟踪数据的图形表示形式。

水平轴：表示调用的时间段和时间。
垂直轴：显示被调用方。
橙色：系统API。
绿色：应用自有方法。
蓝色：第三方API（包括Java API）。

提示

右键点击 Jump to source 跳转至指定函数。

二、Flame Chart

将具备相同调用方顺序的彻底相同的方法收集起来。

水平轴：执行每一个方法的相对时间量。
垂直轴：显示被调用方。

使用技巧

看顶层的哪一个函数占据的宽度最大（表现为平顶），可能存在性能问题。

三、Top Down

递归调用列表，提供self、children、total时间和比率来表示被调用的函数信息。
Flame Chart是Top Down列表数据的图形化。

四、Bottom Up

展开函数会显示其调用方。
按照消耗CPU时间由多到少的顺序对函数排序。

注意事项

咱们在查看上面4个跟踪数据的区域时，应该注意右侧的两个时间，以下所示：

Wall Clock Time：程序执行时间。
Thread Time：CPU执行的时间。

三、TraceView小结

特色

一、图形的形式展现执行时间、调用栈等。
二、信息全面，包含全部线程。
三、运行时开销严重，总体都会变慢，得出的结果并不真实。
四、找到最耗费时间的路径：Flame Chart、Top Down。
五、找到最耗费时间的节点：Bottom Up。

做用

主要作热点分析，用来获得如下两种数据：

单次执行最耗时的方法。
执行次数最多的方法。

五、启动速度分析工具 — Systrace

一、使用方式：代码插桩

首先，咱们能够定义一个Trace静态工厂类，将Trace.begainSection()，Trace.endSection()封装成i、o方法，而后再在想要分析的方法先后进行插桩便可。

而后，在命令行下执行systrace.py脚本，命令以下所示：

python /Users/quchao/Library/Android/sdk/platform-tools/systrace/systrace.py -t 20 sched gfx view wm am app webview -a "com.wanandroid.json.chao" -o ~/Documents/open-project/systrace_data/wanandroid_start_1.html
复制代码

具体参数含义以下：

-t：指定统计时间为20s。
shced：cpu调度信息。
gfx：图形信息。
view：视图。
wm：窗口管理。
am：活动管理。
app：应用信息。
webview：webview信息。
-a：指定目标应用程序的包名。
-o：生成的systrace.html文件。

如何查看数据？

在UIThread一栏能够看到核心的系统方法时间区域和咱们本身使用代码插桩捕获的方法时间区域。

二、Systrace原理

首先，在系统的一些关键链路（如SystemServcie、虚拟机、Binder驱动）插入一些信息（Label）。
而后，经过Label的开始和结束来肯定某个核心过程的执行时间，并把这些Label信息收集起来获得系统关键路径的运行时间信息，最后获得整个系统的运行性能信息;

其中，Android Framework 里面一些重要的模块都插入了label信息，用户App中也能够添加自定义的Lable。

三、Systrace小结

特色

结合Android内核的数据，生成Html报告。
系统版本越高，Android Framework中添加的系统可用Label就越多，可以支持和分析的系统模块也就越多。
必须手动缩小范围，会帮助你加速收敛问题的分析过程，进而快速地定位和解决问题。

做用

主要用于分析绘制性能方面的问题。
分析系统关键方法和应用方法耗时。

六、启动监控

一、实验室监控：视频录制

80%绘制
图像识别

注意

覆盖高中低端机型不一样的场景。

二、线上监控

目标

须要准确地统计启动耗时。

一、启动结束的统计时机

是不是使用界面显示且用户真正能够操做的时间做为启动结束时间。

二、启动时间扣除逻辑

闪屏、广告和新手引导这些时间都应该从启动时间里扣除。

三、启动排除逻辑

Broadcast、Server拉起，启动过程进入后台都须要排除统计。

四、使用什么指标来衡量启动速度的快慢？

平均启动时间的问题

一些体验不好的用户极可能被平均了。

建议的指标

一、快开慢开比

如2s快开比，5s慢开比，能够看到有多少比例的用户体验好，多少比例的用户比较糟糕。

二、90%用户的启动时间

若是90%用户的启动时间都小于5s，那么90%区间的启动耗时就是5s。

五、启动的类型有哪几种？

首次安装启动
覆盖安装启动
冷启动（指标）
热启动（反映程序的活跃或保活能力）

借鉴Facebook的 profilo 工具原理，对启动整个流程进行耗时监控，在后台对不一样的版本作自动化对比，监控新版本是否有新增耗时的函数。

4、启动优化常规方案

启动过程当中的常见问题

一、点击图标好久都不响应：预览窗口被禁用或设置为透明。
二、首页显示太慢：初始化任务太多。
三、首页显示后没法进行操做：太多延迟初始化任务占用主线程CPU时间片。

优化区域

Application、Activity建立以及回调等过程。

一、主题切换

使用Activity的windowBackground主题属性预先设置一个启动图片（layer-list实现），在启动后，在Activity的onCreate()方法中的super.onCreate()前再setTheme(R.style.AppTheme)。

优势

使用简单。
避免了启动白屏和点击启动图标不响应的状况。

缺点

治标不治本，表面上产生一种快的感受。
对于中低端机，总的闪屏时间会更长，建议只在Android6.0/7.0以上才启用“预览闪屏”方案，让手机性能好的用户能够有更好的体验。

二、第三方库懒加载

按需初始化，特别是针对于一些应用启动时不须要初始化的库，能够等到用时才进行加载。

三、异步初始化预备知识-线程优化

一、Android线程调度原理剖析

线程调度原理

一、任意时刻，只有一个线程占用CPU，处于运行状态。
二、多线程并发，轮流获取CPU使用权。
三、JVM负责线程调度，按照特定机制分配CPU使用权。

线程调度模型

一、分时调度模型

轮流获取、均分CPU。

二、抢占式调度模型

优先级高的获取。

如何干预线程调度？

设置线程优先级。

Android线程调度

一、nice值

Process中定义。
值越小，优先级越高。
默认是THREAD_PRIORITY_DEFAUT，0。

二、cgroup

它是一种更严格的群组调度策略，主要分为以下两种类型：

后台group（默认）。
前台group，保证前台线程能够获取到更多的CPU

注意点

线程过多会致使CPU频繁切换，下降线程运行效率。
正确认识任务重要性以决定使用哪一种线程优先级。
优先级具备继承性。

二、Android异步方式

一、Thread

最简单、常见的异步方式。
不易复用，频繁建立及销毁开销大。
复杂场景不易使用。

二、HandlerThread

自带消息循环的线程。
串行执行。
长时间运行，不断从队列中获取任务。

三、IntentService

继承自Service在内部建立HandlerThread。
异步，不占用主线程。
优先级较高，不易被系统Kill。

四、AsyncTask

Android提供的工具类。
无需本身处理线程切换。
需注意版本不一致问题（API 14以上解决）

五、线程池

Java提供的线程池。
易复用，减小频繁建立、销毁的时间。
功能强大，如定时、任务队列、并发数控制等。

六、RxJava

由强大的调度器Scheduler集合提供。

不一样类型的Scheduler：

IO
Computation

异步方式总结

推荐度：从后往前排列。
正确场景选择正确的方式。

三、Android线程优化实战

线程使用准则

一、严禁使用new Thread方式。
二、提供基础线程池供各个业务线使用，避免各个业务线各自维护一套线程池，致使线程数过多。
三、根据任务类型选择合适的异步方式：优先级低，长时间执行，HandlerThread；定时执行耗时任务，线程池。
四、建立线程必须命名，以方便定位线程归属，在运行期 Thread.currentThread().setName 修更名字。
五、关键异步任务监控，注意异步不等于不耗时，建议使用AOP的方式来作监控。
六、重视优先级设置（根据任务具体状况），Process.setThreadPriority() 能够设置屡次。

四、如何锁定线程建立者

锁定线程建立背景

项目变大以后收敛线程。
项目源码、三方库、aar中都有线程的建立。

锁定线程建立方案

特别适合Hook手段，找Hook点：构造函数或者特定方法，如Thread的构造函数。

实战

这里咱们直接使用维数的 epic 对Thread进行Hook。在attachBaseContext中调用DexposedBridge.hookAllConstructors方法便可，以下所示：

DexposedBridge.hookAllConstructors(Thread.class, new XC_MethodHook() { 
    @Override protected void afterHookedMethod（MethodHookParam param）throws Throwable {                         
        super.afterHookedMethod(param); 
        Thread thread = (Thread) param.thisObject; 
        LogUtils.i("stack " + Log.getStackTraceString(new Throwable());
    }
);
复制代码

从log找到线程建立信息，根据堆栈信息跟相关业务方沟通解决方案。

五、线程收敛优雅实践初步

线程收敛常规方案

根据线程建立堆栈考量合理性，使用同一线程库。
各业务线下掉本身的线程库。

问题：基础库怎么使用线程？

直接依赖线程库，但问题在于线程库更新可能会致使基础库更新。

基础库优雅使用线程

基础库内部暴露API：setExecutor。
初始化的时候注入统一的线程库。

统一线程库时区分任务类型

IO密集型任务：IO密集型任务不消耗CPU，核心池能够很大。常见的IO密集型任务如文件读取、写入，网络请求等等。
CPU密集型任务：核心池大小和CPU核心数相关。常见的CPU密集型任务如比较复杂的计算操做，此时须要使用大量的CPU计算单元。

实现用于执行多类型任务的基础线程池组件

目前基础线程池组件位于启动器sdk之中，使用很是简单，示例代码以下所示：

// 若是当前执行的任务是CPU密集型任务，则从基础线程池组件
// DispatcherExecutor中获取到用于执行 CPU 密集型任务的线程池
DispatcherExecutor.getCPUExecutor().execute(YourRunable());

// 若是当前执行的任务是IO密集型任务，则从基础线程池组件
// DispatcherExecutor中获取到用于执行 IO 密集型任务的线程池
DispatcherExecutor.getIOExecutor().execute(YourRunable());
复制代码

具体的实现源码也比较简单，而且我对每一处代码都进行了详细的解释，就不一一具体分析了。代码以下所示：

public class DispatcherExecutor {

    /**
     * CPU 密集型任务的线程池
     */
    private static ThreadPoolExecutor sCPUThreadPoolExecutor;

    /**
     * IO 密集型任务的线程池
     */
    private static ExecutorService sIOThreadPoolExecutor;

    /**
     * 当前设备能够使用的 CPU 核数
     */
    private static final int CPU_COUNT = Runtime.getRuntime().availableProcessors();

    /**
     * 线程池核心线程数，其数量在2 ~ 5这个区域内
     */
    private static final int CORE_POOL_SIZE = Math.max(2, Math.min(CPU_COUNT - 1, 5));

    /**
     * 线程池线程数的最大值：这里指定为了核心线程数的大小
     */
    private static final int MAXIMUM_POOL_SIZE = CORE_POOL_SIZE;

    /**
    * 线程池中空闲线程等待工做的超时时间，当线程池中
    * 线程数量大于corePoolSize（核心线程数量）或
    * 设置了allowCoreThreadTimeOut（是否容许空闲核心线程超时）时，
    * 线程会根据keepAliveTime的值进行活性检查，一旦超时便销毁线程。
    * 不然，线程会永远等待新的工做。
    */
    private static final int KEEP_ALIVE_SECONDS = 5;

    /**
    * 建立一个基于链表节点的阻塞队列
    */
    private static final BlockingQueue<Runnable> S_POOL_WORK_QUEUE = new LinkedBlockingQueue<>();

    /**
     * 用于建立线程的线程工厂
     */
    private static final DefaultThreadFactory S_THREAD_FACTORY = new DefaultThreadFactory();

    /**
     * 线程池执行耗时任务时发生异常所须要作的拒绝执行处理
     * 注意：通常不会执行到这里
     */
    private static final RejectedExecutionHandler S_HANDLER = new RejectedExecutionHandler() {
        @Override
        public void rejectedExecution(Runnable r, ThreadPoolExecutor executor) {
            Executors.newCachedThreadPool().execute(r);
        }
    };

    /**
     * 获取CPU线程池
     *
     * @return CPU线程池
     */
    public static ThreadPoolExecutor getCPUExecutor() {
        return sCPUThreadPoolExecutor;
    }

    /**
     * 获取IO线程池
     *
     * @return IO线程池
     */
    public static ExecutorService getIOExecutor() {
        return sIOThreadPoolExecutor;
    }

    /**
     * 实现一个默认的线程工厂
     */
    private static class DefaultThreadFactory implements ThreadFactory {
        private static final AtomicInteger POOL_NUMBER = new AtomicInteger(1);
        private final ThreadGroup group;
        private final AtomicInteger threadNumber = new AtomicInteger(1);
        private final String namePrefix;

        DefaultThreadFactory() {
            SecurityManager s = System.getSecurityManager();
            group = (s != null) ? s.getThreadGroup() :
                    Thread.currentThread().getThreadGroup();
            namePrefix = "TaskDispatcherPool-" +
                    POOL_NUMBER.getAndIncrement() +
                    "-Thread-";
        }

        @Override
        public Thread newThread(Runnable r) {
            // 每个新建立的线程都会分配到线程组group当中
            Thread t = new Thread(group, r,
                    namePrefix + threadNumber.getAndIncrement(),
                    0);
            if (t.isDaemon()) {
                // 非守护线程
                t.setDaemon(false);
            }
            // 设置线程优先级
            if (t.getPriority() != Thread.NORM_PRIORITY) {
                t.setPriority(Thread.NORM_PRIORITY);
            }
            return t;
        }
    }

    static {
        sCPUThreadPoolExecutor = new ThreadPoolExecutor(
                CORE_POOL_SIZE, MAXIMUM_POOL_SIZE, KEEP_ALIVE_SECONDS, TimeUnit.SECONDS,
                S_POOL_WORK_QUEUE, S_THREAD_FACTORY, S_HANDLER);
        // 设置是否容许空闲核心线程超时时，线程会根据keepAliveTime的值进行活性检查，一旦超时便销毁线程。不然，线程会永远等待新的工做。
        sCPUThreadPoolExecutor.allowCoreThreadTimeOut(true);
        // IO密集型任务线程池直接采用CachedThreadPool来实现，
        // 它最多能够分配Integer.MAX_VALUE个非核心线程用来执行任务
        sIOThreadPoolExecutor = Executors.newCachedThreadPool(S_THREAD_FACTORY);
    }

}
复制代码

六、线程优化核心问题

一、线程使用为何会遇到问题？

项目发展阶段忽视基础设施建设，没有采用统一的线程池，致使线程数量过多。

表现形式

异步任务执行太耗时，致使主线程卡顿。

问题缘由

一、Java线程调度是抢占式的，线程优先级比较重要，须要区分。
二、没有区分IO和CPU密集型任务，致使主线程抢不到CPU。

二、怎么在项目中对线程进行优化？

核心：线程收敛

经过Hook方式找到对应线程的堆栈信息，和业务方讨论是否应该单独起一个线程，尽量使用统一线程池。
每一个基础库都暴露一个设置线程池的方法，以免线程库更新致使基础库须要更新的问题。
统一线程池应注意IO、CPU密集型任务区分。
其它细节：重要异步任务统计耗时、注重异步任务优先级和线程名的设置。

四、异步初始化

一、核心思想

子线程分担主线程任务，并行减小时间。

二、异步优化注意点

一、不符合异步要求。
二、须要在某个阶段完成（采用CountDownLatch确保异步任务完成后才到下一个阶段）。
三、如出现主线程要使用时还没初始化则在这次使用前初始化。
四、区分CPU密集型和IO密集型任务。

三、异步初始化方案演进

一、new Thread
二、IntentService
三、线程池（合理配置并选择CPU密集型和IO密集型线程池）
四、异步启动器

四、异步优化最优解：异步启动器

异步启动器源码及使用demo地址

常规异步优化痛点

一、代码不优雅：例如使用线程池实现多个并行异步任务时会有多个executorService.submit代码块。
二、场景很差处理：各个初始化任务之间存在依赖关系，例如推送sdk的初始化任务须要依赖于获取设备id的初始化任务。此外，有些任务是须要在某些特定的时候就初始化完成，例如须要在Application的onCreate方法执行完以前就初始化完成。
三、维护成本高。

启动器核心思想

充分利用CPU多核，自动梳理任务顺序。

启动器流程

启动器的流程图以下所示：

启动器的主题流程为上图中的中间区域，即主线程与并发两个区域块。须要注意的是，在上图中的 head task与tail task 并不包含在启动器的主题流程中，它仅仅是用于处理启动前/启动后的一些通用任务，例如咱们能够在head task中作一些获取通用信息的操做，在tail task能够作一些log输出、数据上报等操做。

那么，这里咱们总结一下启动的核心流程，以下所示：

一、任务Task化，启动逻辑抽象成Task（Task即对应一个个的初始化任务）。
二、根据全部任务依赖关系排序生成一个有向无环图：例如上述说到的推送SDK初始化任务须要依赖于获取设备id的初始化任务，各个任务之间均可能存在依赖关系，因此将它们的依赖关系排序生成一个有向无环图能将并行效率最大化。
三、多线程按照排序后的优先级依次执行：例如必须先初始化获取设备id的初始化任务，才能去进行推送SDK的初始化任务。

异步启动器优化实战与源码剖析

下面，咱们就来使用异步启动器来在Application的onCreate方法中进行异步优化，代码以下所示：

// 一、启动器初始化
TaskDispatcher.init(this);
// 二、建立启动器实例，这里每次获取的都是新对象
TaskDispatcher dispatcher = TaskDispatcher.createInstance();
// 三、给启动器配置一系列的（异步/非异步）初始化任务并启动启动器
dispatcher
        .addTask(new InitAMapTask())
        .addTask(new InitStethoTask())
        .addTask(new InitWeexTask())
        .addTask(new InitBuglyTask())
        .addTask(new InitFrescoTask())
        .addTask(new InitJPushTask())
        .addTask(new InitUmengTask())
        .addTask(new GetDeviceIdTask())
        .start();
        
// 四、须要等待微信SDK初始化完成，程序才能往下执行
dispatcher.await();
复制代码

这里的 TaskDispatcher 就是咱们的启动器调用类。首先，在注释1处，咱们须要先调用TaskDispatcher的init方法进行启动器的初始化，其源码以下所示：

public static void init(Context context) {
    if (context != null) {
        sContext = context;
        sHasInit = true;
        sIsMainProcess = Utils.isMainProcess(sContext);
    }
}
复制代码

能够看到，仅仅是初始化了几个基础字段。接着，在注释2处，咱们建立了启动器实例，其源码以下所示：

/**
 * 注意：这里咱们每次获取的都是新对象
 */
public static TaskDispatcher createInstance() {
    if (!sHasInit) {
        throw new RuntimeException("must call TaskDispatcher.init    first");
    }
    return new TaskDispatcher();
}
复制代码

在createInstance方法的中咱们每次都会建立一个新的TaskDispatcher实例。而后，在注释3处，咱们给启动器配置了一系列的初始化任务并启动启动器，须要注意的是，这里的Task既能够是用于执行异步任务（子线程）的也能够是用于执行非异步任务（主线程）。下面，咱们来分析下这两种Task的用法，好比InitStethoTask这个异步任务的初始化，代码以下所示：

/**
 * 异步的Task
*/
public class InitStethoTask extends Task {

    @Override
    public void run() {
        Stetho.initializeWithDefaults(mContext);
    }
}
复制代码

这里的InitStethoTask直接继承自Task，Task中的runOnMainThread方法返回为false，说明 task 是用于处理异步任务的task，其中的run方法就是Runnable的run方法。下面，咱们再看看另外一个用于初始化非异步任务的例子，例如用于微信SDK初始化的InitWeexTask，代码以下所示：

/**
* 主线程执行的task
*/
public class InitWeexTask extends MainTask {

    @Override
    public boolean needWait() {
        return true;
    }

    @Override
    public void run() {
        InitConfig config = new InitConfig.Builder().build();
        WXSDKEngine.initialize((Application) mContext, config);
    }
}
复制代码

能够看到，它直接继承了MainTask，MainTask的源码以下所示：

public abstract class MainTask extends Task {

    @Override
    public boolean runOnMainThread() {
        return true;
    }
    
}
复制代码

MainTask 直接继承了Task，并仅仅是重写了runOnMainThread方法返回了true，说明它就是用来初始化主线程中的非异步任务的。

此外，咱们注意到InitWeexTask中还重写了一个needWait方法并返回了true，其目的是为了在某个时刻以前必须等待InitWeexTask初始化完成程序才能继续往下执行，这里的某个时刻指的就是咱们在Application的onCreate方法中的注释4处的代码所执行的地方：dispatcher.await()，其实现源码以下所示：

/**
 * 须要等待的任务数
 */
private AtomicInteger mNeedWaitCount = new AtomicInteger();

/**
 * 调用了 await 还没结束且须要等待的任务列表
 */
private List<Task> mNeedWaitTasks = new ArrayList<>();

private CountDownLatch mCountDownLatch;

private static final int WAITTIME = 10000;

@UiThread
public void await() {
    try {
        // 一、仅仅在测试阶段才输出需等待的任务列表数与任务名称
        if (DispatcherLog.isDebug()) {
            DispatcherLog.i("still has " + mNeedWaitCount.get());
            for (Task task : mNeedWaitTasks) {
                DispatcherLog.i("needWait: " + task.getClass().getSimpleName());
            }
        }

        // 二、只要还有须要等待的任务没有执行完成，就调用mCountDownLatch的await方法进行等待，这里咱们设定超时时间为10s
        if (mNeedWaitCount.get() > 0) {
            if (mCountDownLatch == null) {
                throw new RuntimeException("You have to call start() before call await()");
            }
            mCountDownLatch.await(WAITTIME, TimeUnit.MILLISECONDS);
        }
    } catch (InterruptedException e) {
    }
}
复制代码

首先，在注释1处，咱们仅仅只会在测试阶段才会输出需等待的任务列表数与任务名称。而后，在注释2处，只要须要等待的任务数mNeedWaitCount大于0，即只要还有须要等待的任务没有执行完成，就调用mCountDownLatch的await方法进行等待，注意咱们这里设定了超时时间为10s。当一个task执行完成后，不管它是异步仍是非异步的，最终都会执行到mTaskDispatcher的markTaskDone(mTask)方法，咱们看看它的实现源码，以下所示：

/**
* 已经结束的Task
*/
private volatile List<Class<? extends Task>> mFinishedTasks = new ArrayList<>(100);

public void markTaskDone(Task task) {
    if (ifNeedWait(task)) {
        mFinishedTasks.add(task.getClass());
        mNeedWaitTasks.remove(task);
        mCountDownLatch.countDown();
        mNeedWaitCount.getAndDecrement();
    }
}
复制代码

能够看到，这里每执行完成一个task，就会将mCountDownLatch的锁计数减1，与此同时，也会将咱们的mNeedWaitCount这个原子整数包装类的数量减1。

此外，咱们在前面说到了启动器将各个任务之间的依赖关系抽象成了一个有向无环图，在上面一系列的初始化代码中，InitJPushTask是须要依赖于GetDeviceIdTask的，那么，咱们怎么告诉启动器它们二者之间的依赖关系呢？

这里只须要在InitJPushTask中重写dependsOn()方法，并返回包含GetDeviceIdTask的task列表便可，代码以下所示：

/**
* InitJPushTask 须要在 getDeviceId 以后执行
*/
public class InitJPushTask extends Task {

    @Override
    public List<Class<? extends Task>> dependsOn() {
        List<Class<? extends Task>> task = new ArrayList<>();
        task.add(GetDeviceIdTask.class);
        return task;
    }

    @Override
    public void run() {
        JPushInterface.init(mContext);
        MyApplication app = (MyApplication) mContext;
        JPushInterface.setAlias(mContext, 0, app.getDeviceId());
    }
}
复制代码

至此，咱们的异步启动器就分析完毕了。下面咱们来看看如何高效地进行延迟初始化。

五、延迟初始化

一、常规方案：利用闪屏页的停留时间进行部分初始化

new Handler().postDelayed()。
界面UI展现后调用。

二、常规初始化痛点

时机不容易控制：handler postDelayed指定的延迟时间很差估计。
致使界面UI卡顿：此时用户可能还在滑动列表。

三、延迟优化最优解：延迟启动器

延迟启动器源码及使用demo地址

核心思想

利用IdleHandler特性，在CPU空闲时执行，对延迟任务进行分批初始化。

延迟启动器优化实战与源码剖析

延迟初始化启动器的代码很简单，以下所示：

/**
 * 延迟初始化分发器
 */
public class DelayInitDispatcher {

    private Queue<Task> mDelayTasks = new LinkedList<>();

    private MessageQueue.IdleHandler mIdleHandler = new     MessageQueue.IdleHandler() {
        @Override
        public boolean queueIdle() {
            // 分批执行的好处在于每个task占用主线程的时间相对
            // 来讲很短暂，而且此时CPU是空闲的，这些能更有效地避免UI卡顿
            if(mDelayTasks.size()>0){
                Task task = mDelayTasks.poll();
                new DispatchRunnable(task).run();
            }
            return !mDelayTasks.isEmpty();
        }
    };

    public DelayInitDispatcher addTask(Task task){
        mDelayTasks.add(task);
        return this;
    }

    public void start(){
        Looper.myQueue().addIdleHandler(mIdleHandler);
    }

}
复制代码

在DelayInitDispatcher中，咱们提供了mDelayTasks队列用于将每个task添加进来，使用者只需调用addTask方法便可。当CPU空闲时，mIdleHandler便会回调自身的queueIdle方法，这个时候咱们能够将task一个一个地拿出来并执行。这种分批执行的好处在于每个task占用主线程的时间相对来讲很短暂，而且此时CPU是空闲的，这样能更有效地避免UI卡顿，真正地提高用户的体验。

至于使用就很是简单了，咱们能够直接利用SplashActivity的广告页停留时间去进行延迟初始化，代码以下所示：

@Override
public void onWindowFocusChanged(boolean hasFocus) {
    super.onWindowFocusChanged(hasFocus);
    GlobalHandler.getInstance().getHandler().post((Runnable) () -> {
        if (hasFocus) {
            DelayInitDispatcher delayInitDispatcher = new DelayInitDispatcher();
            delayInitDispatcher.addTask(new InitOtherTask())
                    .start();
        }
    });
}
复制代码

须要注意的是，能异步的task咱们会优先使用异步启动器在Application的onCreate方法中加载（或者是必须在Application的onCreate方法完成前必须执行完的非异task务），对于不能异步的task，咱们能够利用延迟启动器进行加载。若是任务能够到用时再加载，能够使用懒加载的方式。

延迟启动器优点

执行时机明确。
缓解界面UI卡顿。
真正提高用户体验。

六、Multidex预加载优化

咱们都知道，安装或者升级后首次 MultiDex 花费的时间过于漫长，咱们须要进行Multidex的预加载优化。

一、优化步骤

一、启动时单独开一个进程去异步进行Multidex的第一次加载，即Dex提取和Dexopt操做。
二、此时，主进程Application进入while循环，不断检测Multidex操做是否完成。
三、执行到Multidex时，则已经发现提取并优化好了Dex，直接执行。MultiDex执行完以后主进程Application继续执行ContentProvider初始化和Application的onCreate方法。

Multidex优化Demo地址

注意

5.0以上默认使用ART，在安装时已将Class.dex转换为oat文件了，无需优化，因此应判断只有在主进程及SDK 5.0如下才进行Multidex的预加载。

二、dex-opt过程是怎样的？

主要包括inline以及quick指令的优化。

那么，inline是什么？

使编译器在函数调用处用函数体代码代替函数调用指令。

inline的做用？

函数调用的转移操做有必定的时间和空间方面的开销，特别是对于一些函数体不大且频繁调用的函数，解决其效率问题更为重要，引入inline函数就是为了解决这一问题。

inline又是如何进行优化的？

inline函数至少在三个方面提高了程序的时间性能：

一、避免了函数调用必须执行的压栈出栈等操做。
二、因为函数体代码被移到函数调用处，编译器能够得到更多的上下文信息，并根据这些信息对函数体代码和被调用者代码进行更进一步的优化。
三、若不使用inline函数，程序执行至函数调用处，须要转而去执行函数体所在位置的代码。通常函数调用位置和函数代码所在位置在代码段中并不相近，这样很容易造成操做系统的缺页中断。操做系统须要把缺页地址的代码从硬盘移入内存，所需时间将成数量级增长。而使用inline函数则能够减小缺页中断发生的机会。

对于inline的使用，咱们应该注意的问题？

一、因为inline函数在函数调用处插入函数体代码代替函数调用，若该函数在程序的不少位置被调用，有可能形成内存空间的浪费。
二、通常程序的压栈出栈操做也须要必定的代码，这段代码完成栈指针调整、参数传递、现场保护和恢复等操做。若函数的函数体代码量小于编译器生成的函数压栈出栈代码，则能够放心地定义为inline，这个时候占用内存空间反而会减少。而当函数体代码大于函数压栈出栈代码时，将函数定义为inline就会增长内存空间的使用。
三、C++程序应该根据应用的具体场景、函数体大小、调用位置多少、函数调用的频率、应用场景对时间性能的要求，应用场景对内存性能的要求等各方面因素合理决定是否认义inline函数。
四、inline函数内不容许用循环语句和开关语句。

三、抖音BoostMultiDex优化

为了完全解决MutiDex加载时间慢的问题，抖音团队深刻挖掘了 Dalvik 虚拟机的底层系统机制，对 DEX 相关的处理逻辑进行了从新设计与优化，并推出了 BoostMultiDex 方案，它可以减小 80% 以上的黑屏等待时间，挽救低版本 Android 用户的升级安装体验。若有兴趣的同窗能够看看这篇文章：抖音BoostMultiDex优化实践：Android低版本上APP首次启动时间减小80%

四、预加载SharedPreferences

能够利用MultiDex预加载期间的这段CPU去预加载SharedPreferences。

注意

需重写getApplicationContext返回this，不然此时可能获取不到context。

七、类预加载优化

在Application中提早异步加载初始化耗时较长的类。

如何找到耗时较长的类？

替换系统的ClassLoader，打印类加载的时间，按需选取须要异步加载的类。

注意

Class.forName()只加载类自己及其静态变量的引用类。
new 类实例能够额外加载类成员变量的引用类。

八、WebView启动优化

一、WebView首次建立比较耗时，须要预先建立WebView提早将其内核初始化。
二、使用WebView缓存池，用到WebView的时候都从缓存池中拿，注意内存泄漏问题。
三、本地离线包，即预置静态页面资源。

九、页面数据预加载

在主页空闲时，将其它页面的数据加载好保存到内存或数据库，等到打开该页面时，判断已经预加载过，就直接从内存或数据库取数据并显示。

十、启动阶段不启动子进程

子进程会共享CPU资源，致使主进程CPU紧张。此外，在多进程状况下必定要能够在onCreate中去区分进程作一些初始化工做。

注意启动顺序

App onCreate以前是ContentProvider初始化。

十一、闪屏页与主页的绘制优化

一、布局优化。
二、过渡绘制优化。

关于布局与绘制优化能够参考Android性能优化之绘制优化。

5、启动优化黑科技

一、启动阶段抑制GC

启动时CG抑制，容许堆一直增加，直到手动或OOM中止GC抑制。（空间换时间）

前提条件

一、设备厂商没有加密内存中的Dalvik库文件。
二、设备厂商没有改动Google的Dalvik源码。

实现原理

一、首先，在源码级别找到抑制GC的修改方法，例如改变跳转分支。
二、而后，在二进制代码里找到 A 分支条件跳转的"指令指纹"，以及用于改变分支的二进制代码，假设为 override_A。
三、最后，应用启动后扫描内存中的 libdvm.so，根据"指令指纹"定位到修改位置，并使用 override_A 覆盖。

缺点

须要白名单覆盖全部设备，但维护成本高。

二、CPU锁频

一个设备的CPU一般都是4核或者8核，可是应用在通常状况下对CPU的利用率并不高，可能只有30%或者50%，若是咱们在启动速度暴力拉伸CPU频率，以此提升CPU的利用率，那么，应用的启动速度会提高很多。

在Android系统中，CPU相关的信息存储在/sys/devices/system/cpu目录的文件中，经过对该目录下的特定文件进行写值，实现对CPU频率等状态信息的更改。

缺点

暴力拉伸CPU频率，致使耗电量增长。

CPU工做模式

performance：最高性能模式，即便系统负载很是低，cpu也在最高频率下运行。
powersave：省电模式，与performance模式相反，cpu始终在最低频率下运行。
ondemand：CPU频率跟随系统负载进行变化。
userspace：能够简单理解为自定义模式，在该模式下能够对频率进行设定。

CPU的工做频率范围

对应的文件有：

cpuinfo_max_freq
cpuinfo_min_freq
scaling_max_freq
scaling_min_freq

三、IO优化

一、启动过程不建议出现网络IO。
二、为了只解析启动过程当中用到的数据，应选择合适的数据结构，如将ArrayMap改形成支持随机读写、延时解析的数据存储结构以替代SharePreference。

这里须要注意的是，须要考虑重度用户的使用场景。

补充加油站：Linux IO知识

一、磁盘高速缓存技术

利用内存中的存储空间来暂存从磁盘中读出的一系列盘块中的信息。所以，磁盘高速缓存在逻辑上属于磁盘，物理上则是驻留在内存中的盘块。

其内存中分为两种形式：

在内存中开辟一个单独的存储空间做为磁速缓存，大小固定。
把未利用的内存空间做为一个缓沖池，供请求分页系统和磁盘I/O时共享。

二、分页

存储器管理的一种技术。
能够使电脑的主存使用存储在辅助存储器中的数据。
操做系统会将辅助存储器（一般是磁盘）中的数据分区成固定大小的区块，称为“页”（pages）。当不须要时，将分页由主存（一般是内存）移到辅助存储器；当须要时，再将数据取回，加载主存中。
相对于分段，分页容许存储器存储于不连续的区块以维持文件系统的整齐。
分页是磁盘和内存间传输数据块的最小单位。

三、高速缓存/缓冲器

都是介于高速设备和低速设备之间。
高速缓存存放的是低速设备中某些数据的复制数据，而缓冲器则可同时存储高低速设备之间的数据。
高速缓存存放的是高速设备常常要访问的数据。

四、linux同步IO：sync、fsync、msync、fdatasync

为何要使用同步IO？

当数据写入文件时，内核一般先将该数据复制到缓冲区高速缓存或页面缓存中，若是该缓冲区还没有写满，则不会将其排入输入队列，而是等待其写满或内核须要重用该缓冲区以便存放其余磁盘块数据时，再将该缓冲排入输出队列，最后等待其到达队首时，才进行实际的IO操做—延迟写。

延迟写减小了磁盘读写次数，可是却下降了文件内容的更新速度，可能会形成文件更新内容的丢失。为了保证数据一致性，则需使用同步IO。

sync

sync函数只是将全部修改过的块缓冲区排入写队列，而后就返回，它并不等待实际磁盘写操做结束再返回。
一般称为update的系统守护进程会周期性地（通常每隔30秒）调用sync函数。这就保证了按期冲洗内核的块缓冲区。

fsync

fsync函数只对文件描述符filedes指定的单一文件起做用，而且等待磁盘IO写结束后再返回。一般应用于须要确保将修改内容当即写到磁盘的应用如数据库。
文件的数据和metadata一般存放在硬盘的不一样地方，所以fsync至少须要两次IO操做。

msync

若是当前硬盘的平均寻道时间是3-15ms，7200RPM硬盘的平均旋转延迟大约为4ms，所以一次IO操做的耗时大约为10ms。

若是使用内存映射文件的方式进行文件IO（mmap），将文件的page cache直接映射到进程的地址空间，这时须要使用msync系统调用确保修改的内容彻底同步到硬盘之上。

fdatasync

fdatasync函数相似于fsync，但它只影响文件的数据部分。而fsync还会同步更新文件的属性。
仅仅只在必要（如文件尺寸须要当即同步）的状况下才会同步metadata，所以能够减小一次IO操做。

日志文件都是追加性的，文件尺寸一致在增大，如何利用好fdatasync减小日志文件的同步开销？

建立每一个log文件时先写文件的最后一个page，将log文件扩展为10MB大小，这样即可以使用fdatasync，每写10MB只有一次同步metadata的开销。

五、磁盘IO与网络IO

磁盘IO（缓存IO）

标准IO，大多数文件系统默认的IO操做。

数据先从磁盘复制到内核空间的缓冲区，而后再从内核空间中的缓冲区复制到应用程序的缓冲区。
读操做：操做系统检查内核的缓冲区有没有须要的数据，若是已经有缓存了，那么直接从缓存中返回；不然，从磁盘中返回，再缓存在操做系统的磁盘中。
写操做：将数据从用户空间复制到内核空间中的缓冲区中，这时对用户来讲写操做就已经完成，至于何时写到磁盘中，由操做系统决定，除非显示地调用了sync同步命令。

优势

在必定程度上分离了内核空间和用户空间，保护系统自己安全。
能够减小磁盘IO的读写次数，从而提升性能。

缺点

DMA方式能够将数据直接从磁盘读到页缓存中，或者将数据从页缓存中写回到磁盘，而不能在应用程序地址空间和磁盘之间进行数据传输，这样，数据在传输过程当中须要在应用程序地址空间（用户空间）和缓存（内核空间）中进行屡次数据拷贝操做，这带来的CPU以及内存开销是很是大的。

磁盘IO主要的延时（15000RPM硬盘为例）

机械转动延时（平均2ms）+ 寻址延时（2~3ms）+ 块传输延时（0.1ms左右）=> 平均5ms

网络IO主要延时

服务器响应延时 + 带宽限制 + 网络延时 + 跳转路由延时 + 本地接收延时（通常为几十毫秒到几千毫秒，受环境影响极大）

六、PIO与DMA

PIO

很早以前，磁盘和内存之间的数据传输是须要CPU控制的，也就是读取磁盘文件到内存中时，数据会通过CPU存储转发，这种方式称为PIO。

DMA（直接内存访问，Direct Memory Access）

能够不通过CPU而直接进行磁盘和内存的数据交换。
CPU只须要向DMA控制器下达指令，让DMA控制器来处理数据的传送便可。
DMA控制器经过系统总线来传输数据，传送完毕再通知CPU，这样就在很大程度上下降了CPU占用率，大大节省了系统资源，而它的传输速度与PIO的差别并不明显，而这主要取决于慢速设备的速度。

七、直接IO与异步IO

直接IO

应用程序直接访问磁盘数据，而不通过内核缓冲区。以减小从内核缓冲区到用户数据缓存的数据复制。

异步IO

当访问数据的线程发出请求后，线程会接着去处理其它事情，而不是阻塞等待。

八、VFS（虚拟文件系统，Virtual File System）

能够为访问文件系统的系统调用提供一个统一的抽象接口。

四、数据重排

Dex文件用到的类和APK里面各类资源文件都比较小，读取频繁，且磁盘地址分布范围比较广。咱们能够利用Linux文件IO流程中的page cache机制将它们按照读取顺序从新排列在一块儿，以减小真实的磁盘IO次数。

一、类重排

使用Facebook的 ReDex 的Interdex调整类在Dex中的排列顺序。

二、资源文件重排

一、最佳方案是修改内核源码，实现统计、度量、自动化，其次也能够使用Hook框架进行统计得出资源加载顺序列表。
二、最后，调整apk文件列表须要修改7zip源码以支持传入文件列表顺序。

技术视野

所谓的创新，不必定是要创造史无前例的东西，也能够将已有的方案移植到新的平台，并结合该平台的特性落地，就是一个很大的创新。
当咱们足够熟悉底层的知识时，能够利用系统的特性去作更加深层次的优化。

三、了解Hook框架

Xposed框架是什么？

一个能够不修改APK就影响程序运行的Hook框架。

原理

用自身实现的app_process替换掉系统/system/bin/app_process，加载一个额外的XposedBridge的jar包，用于将入口osZygoteInit.main()替换成XposedBridge.main()。以后，建立的Zygote进程和其子进程都是Hook过的了。

使用具体细节参见Xposed教程。

五、类加载优化（Dalvik）

一、类预加载原理

对象第一次建立的时候，JVM首先检查对应的Class对象是否已经加载。若是没有加载，JVM会根据类名查找.class文件，将其Class对象载入。同一个类第二次new的时候就不须要加载类对象，而是直接实例化，建立时间就缩短了。

二、类加载优化过程

在Dalvik VM加载类的时候会有一个类校验过程，它须要校验方法的每个指令。
经过Hook去掉verify步骤 -> 几十ms的优化
最大优化场景在于首次安装和覆盖安装时，在Dalvik平台上，一个2MB的Dex正常须要350ms，将classVerifyMode设为VERIFY_MODE_NONE后，只需150ms，节省超过50%时间。

ART比较复杂，Hook须要兼容几个版本。并且在安装时，大部分Dex已经优化好了，去掉ART平台的verify只会对动态加载的Dex带来一些好处。因此暂时不建议在ART平台使用。

三、延伸：插件化和热修复

它们在设计上都存在大量的Hook和私有API调用，共同的缺点有以下两类问题。

一、稳定性较差

因为厂商的兼容性、安装失败、ART加载时dex2oat失败等缘由，仍是会有一些代码和资源的异常。Android P推出的non-sdk-interface调用限制，之后适配只会愈来愈难，成本愈来愈高。

二、性能问题

用到一些黑科技致使底层Runtime的优化享受不到。如Tinker加载补丁后，启动速度会下降5%~10%。

一、各项热补丁技术的优缺点

缺点

只针对单一客户端版本，随着版本差别变大补丁体积也会变大。
不支持全部修改，如AndroidManifest。
对代码和资源的更新成功率没法达到100%。

优势

下降开发成本，轻量而快速地升级。发布补丁等同于发布版本，也应该完整地执行测试与上线流程。
远端调试，只为特定用户发送补丁。
数据统计，对同一批用户更换补丁版本，可以更好地进行ABTest，获得更精确的数据。

二、InstanceRun实现机制

Android官方使用热补丁技术实现InstantRun。

应用构建流程

构建 -> 部署 -> 安装 -> 重启app -> 重启activity

实现目标

尽量多的剔除没必要要的步骤，而后提高必要步骤的速度。

InstantRun构建的三种方式

一、HotSwap

增量构建 -> 改变部署

场景：

适用于多数简单的改变（包括一些方法实现的修改，或者变量值修改）。

二、Warm Swap

增量构建 -> 改变部署 -> activity重启

场景：

通常是修改了resources。

三、Cold Swap

增量构建 -> 改变部署 -> 应用重启 -> activity重启

场景：

涉及结构性变化，如修改了继承规则或方法签名。

首次运行Instant Run，Gradle执行的操做

在有Instant Run的环境下：一个新的App Server会被注入到App中，与Bytecode instrumentation协同监控代码的变化。
同时会有一个新的Application类，它注入了一个自定义类加载器。同时该Application会启动咱们所需的新注入的App Server。因而，AndroidManifest会被修改来确保咱们能使用这个新的Application。
使用的时候，它会经过决策，合理运用冷温热拔插来协助咱们大量地缩短构建程序的时间。

HotSwap原理

Android Studio monitors 运行着Gradle任务来生成增量.dex文件（dex对应着开发中的修改类），AS会提取这些.dex文件发送到App Server，而后部署到App。由于原来版本的类都装载在运行中的程序了，Gradle会解释更新好这些.dex文件，发送到App Server的时候，交给自定义的类加载器来加载.dex文件。 App Server会不断地监听是否须要重写类文件，若是须要，任务会被立马执行，新的更改便能当即被响应。

须要注意的是，此时InstantRun是不能回退的，必须重启应用响应修改。

WarmSwap原理

由于资源文件是在Activity建立时加载，因此必须重启Activity加载资源文件。

注意：AndroidManifest的值是在APK安装的时候被读取的，因此须要触发一个完整的应用构建和部署。

ColdSwap原理

应用部署的时候，会把工程拆分红十个部分，每一个部分都拥有本身的.dex文件，而后全部的类会根据包名被分配给相应的.dex文件。当ColdSwap开启时，修改过的类所对应的的.dex文件，会重组生成新的.dex文件，而后再部署到设备上。

注意：应用多进程会被降级为ColdSwap。

三、apk打包流程

manifest文件合并、打包，和res一块儿被AAPT合并到APK中，同时项目代码被编译成字节码，而后转换成.dex文件，也被合并到APK中。

Android打包流程回顾，最后对于release签名apk须要进行zipalign优化，它是指什么？

在回答这个问题以前，咱们须要先了解下内存对齐（DSA，Data Structure Alignment）：

各类类型的数据按照必定的规则在内存空间上排列，这就是对齐。
复制代码

内存对齐的优点在于可以以空间换时间，减小数据存取指令周期，提高程序运行时的速度。

编译器内存字节对齐的原则是什么？

一、数据类型的自身对齐值就是其长度（64位 OS）。
二、结构体或类的自身对齐值就是成员中自身对齐值最大的那个。须要起始地址必须是其相应有效对齐值的整数，并要求结构体的大小也为该结构体有效对齐值的整数倍。

zipalign优化的最根本目的是帮助操做系统更高效地根据请求索引资源，使用resource-handling code统一将DSA限定为4byte。

手动执行Align优化

利用build-tools文件夹下对应Android版本中的zipalign工具：

zipalign -v 4 source.apk androidres.apk
复制代码

检查当前APK是否已经执行过Align优化：

zipalign -c -v 4 androidres.apk
复制代码

其中：

-c：检查。
-v：表明详细输出。
4：表明对齐为4个字节。

四、AndFix

实现原理

native hook -> dalvik_repleaceMethod -> 没法支持新增或删除filed的状况 -> 需修复特定问题

优势

当即生效
补丁较小

缺点

兼容性不佳
开发不透明

五、Qzone

它是一个基于Android Dex分包方案。它将多个dex文件放入到app的classloader中，可是android dex拆包方案中的类是没有重复的，若是classes.dex和classes1.dex中有重复的类，当用到这个重复的类时，系统会选择哪一个类进行加载呢？

一个ClassLoader能够包含多个dex文件，每一个dex文件是一个Elements，多个dex文件排列成有序的dexElements，当找类的时候，会按顺序遍历dex文件，而后从当前遍历的dex文件中找类，若是找到则返回，若是找不到从下一个dex文件继续查找。

因此，若是在不一样的dex中有相同的类存在，那么会优先选择排在前面的dex文件的类。

Qzone热补丁方案就是把有问题的类打包到一个dex（patch.dex）中去，而后把这个dex插入到Elements的最前面。

实现中遇到的问题

一、当其它dex文件中的类引用了patch.dex中的类时，会出现校验错误。拆分dex的不少类都不是在同一个dex内的，怎么没有问题？

由于这个校验有个前提，当引用类被打上了CLASS_ISPREVERIFIED标志，那么就会进行dex的校验。

二、CLASS_ISPREVERIFIED标志是何时被打上去的？

在dex转换成odex（dexopt过程）时，当apk在安装的时候，apk中的classes.dex会被虚拟机（dexopt）优化成odex文件，而后才会拿去执行。
虚拟机在启动的时候，会有许多的启动参数，其中一项就是verify选项，当verify选项被打开时，doVerify变量为true，那么就会执行dvmVerifyClass进行类的校验，若是校验成功，这个类会被打上CLASS_ISPREVERIFIED标志。

具体的校验过程是怎么样的？

有两步验证：

一、验证clazz -> directMethods方法，其包含如下方法：

static方法
private方法
构造函数

二、clazz -> virtualMethods

虚函数 = override方法

若是以上方法中直接引用到的类（第一层级关系，不会进行递归搜索）和clazz都在同一个dex中的话，那么这个类就会被打上CLASS_ISPREVERIFED标志。

为了解决补丁方案中遇到的问题，因此必须从这些方法中入手，防止类被打上CLASS_ISPREVERIFIED标志。空间的方案是往全部类的构造函数里面插入一段代码：

If (ClassVerifier.PREVENT_VERIFY) {
    System.out.println(AntilazyLoad.class);
}
复制代码

其中AntilazyLoad类会被打包成单独的hack.dex，这样当安装apk的时候，classes.dex中的类都会引用一个在不一样dex中的AntilazyLoad类，这样就防止类被打上了CLASS_ISPREVERIFILED标志，只要没被打上这个标志的类均可以进行打补丁操做。

注意：

一、在应用启动进行加载时，AntilazyLoad类所在的dex包必须先加载进来，否则AntilazyLoad类会被标记为不存在，即便后续加载了hack.dex包，那么它也是不存在的。
二、当在Application的onCreate中加载hack.dex时，Application不能插入上述代码。

为何要选择构造函数？

由于他不增长方法数，一个类即便没有显示的构造函数，也有一个隐式的默认构造函数。

如何更高效地插入上述代码？

能够使用ASM/javaassist库在编译期间将相应的字节码插入Class文件中。

Art的处理

Art采用了新的方式，插桩对代码的执行效率没有影响。可是补丁中的类出现修改类变量或者方法，可能会致使出现内存地址错乱的状况。

缘由：

dex2oat时fast*已经将类能肯定的各个地址写死。若是运行时补丁包的地址出现改变，原始类去调用时就会出现地址错乱。

解决方法：

将其父类以及调用类的全部类都加入到补丁包中。

虚拟机在安装期间为类打上CLASS_ISPREVERIFIED标志是为了什么？

为了提升性能。

禁用CLASS_ISPREVERIFIED是否会影响APP的性能？

因为如今不少App都使用了MultiDex分包方案，这致使了不少类都没有被打上这个标志，因此此时禁用全部类打上CLASS_ISPREVERIFIED标志对性能的影响不是很大。

如何有效地生成补丁包？

一、在正式版本发布的时候，会生成一份缓存文件，里面记录了全部class文件的MD5值，还有一份mapping混淆文件。
二、在后续的版本中使用-applaymapping选项，应用正式版本的mapping文件，而后计算编译完成的class文件的MD5和正式版本进行比较，把不相同的class文件打包成补丁包。

Qzone方案缺点

在补丁包大小与性能损耗上有必定的局限性。

六、ASM字节码插桩

插桩就是将一段代码插入或者替换本来的代码。字节码插桩就是在咱们的代码编译成字节码（Class）后，在Android下生成dex以前修改Class文件，修改或者加强原有代码逻辑的操做。

除了AspectJ、Javassist框架外，还有一个应用更为普遍的ASM框架一样也是字节码操做框架，Instant Run包括Javassist就是借助ASM来实现各自的功能。

能够这样理解Class字节码与ASM之间的联系：

JSON对于GSON就相似于字节码Class对于Javassist/ASM。
复制代码

Android ASM自动埋点方案实践

Android 1.5.0版本之后提供了Transform API，容许第三方Plugin在打包dex文件以前的编译过程当中操做.class文件，咱们作的就是实现Transform进行.class文件遍历拿到全部方法，修改完成后对文件进行替换。

大体的流程以下所示：

一、自动埋点追踪，遍历全部文件更换字节码

AutoTransform -> transform -> inputs.each {TransformInput input -> input.jarInput.each { JarInput jarInput -> … } input.directoryInputs.each { DirectoryInput directoryInput -> … }}
复制代码

二、Gradle插件实现

PluginEntry -> apply -> def android = project.extensions.getByType(AppExtension)

registerTransform(android) -> AutoTransform transform = new AutoTransform

android.registerTransform(transform)
复制代码

三、使用ASM进行字节码编写

ASM框架核心类

ClassReader：读取编译后的.class文件。
ClassWriter：从新构建编译后的类。
ClassVisitor：拜访类成员信息。
AdviceAdapter：实现MethodVisitor接口，拜访方法的信息。

一、visit -> 在ClassVisitor中根据判断是不是实现View$OnClickListener接口的类，只有知足条件的类才会遍历其中的方法进行操做。

二、在MethodVisitor中对该方法进行修改

visitAnnotation -> onMethodEnter -> onMethodExit
复制代码

三、先在java文件中编写要插入的代码，而后使用ASM插件查看对应的字节码，根据其用ASM提供的Api一一对应地把代码填进来便可。

关于编译插桩的知识，笔者后面会有一系列的文章进行深刻讲解，具体的文章目录能够在这里查看。

七、Tinker

原理

全量替换新的Dex
在编译时经过新旧两个Dex生成差别patch.dex。在运行时，将差别patch.dex从新跟原始安装包的旧Dex还原为新的Dex。因为比较耗费时间与内存，放在后台进程:patch中，为了补丁包尽量小，微信自研了DexDiff算法，它深度利用Dex的格式来减小差别的大小。

DexDiff的粒度是Dex格式的每一项，BsDiff的粒度是文件，AndFix/Qzone的粒度为class。

缺点

一、占用Rom体积，1.5倍所修改Dex大小 = Dex.jar + dexopt文件。
二、一个额外的合成过程，合成时间长短和额外的内存消耗也会影响最终的成功率。

热补丁方案对比

若不care性能损耗与补丁包大小，Qzone是最简单且成功率最高的方案。

八、完善的热补丁系统构建

1、网络通道

负责将补丁包交付给用户，包括特定用户和全量用户。

一、pull通道

在登陆/24小时等时机，经过pull方式查询后台是否有对应的补丁包更新。

二、指定版本的push通道

在紧急状况下，咱们能够在一个小时内向全部用户下发补丁包更新。

三、指定特定用户的push通道

对特定用户或用户组作远程调试。

2、上线与管理平台

快速上线，管理历史记录，以及监控补丁的运行状况。

六、保活

一、厂商合做

二、微信Hardcoder

构建了App与系统（ROM）之间可靠的通讯框架，让系统知道App的需求。

原理

一、其实质是让App跨过Framework直接跟厂商ROM通讯。
二、分为Client端和Server端，Server端由厂商系统侧自行实现。
三、它们直接采用 LocalSocket 方式，Hardcoder是 Native 实现的，使用了Linux的Socket接口实现了一套本身的LocalSocket。

性能提高有多少？

平均10%~30%。

三、OPPO Hyper Boost加速引擎

一种优化资源调度的技术。

原理

让应用程序与系统资源实现实时"双向对话"。当来自应用和游戏程序的不一样场景和用户行为被Hyper Boost识别后，手机会智能地匹配到合理的系统资源，让手机SoC的CPU、GPU、ISP、DSP提供的运算资源更加合理地利用，从而让用户使用手机更加流畅。

6、启动优化的常见问题

一、启动优化是怎么作的？

一、分析现状、确认问题
二、针对性优化（先归纳，引导其深刻）
三、长期保持优化效果

在某一个版本以后呢，咱们会发现这个启动速度变得特别慢，同时用户给咱们的反馈也愈来愈多，因此，咱们开始考虑对应用的启动速度来进行优化。而后，咱们就对启动的代码进行了代码层面的梳理，咱们发现应用的启动流程已经很是复杂，接着，咱们经过一系列的工具来确认是否在主线程中执行了太多的耗时操做。

咱们通过了细查代码以后，发现应用主线程中的任务太多，咱们就想了一个方案去针对性地解决，也就是进行异步初始化。（引导=>第2题）而后，咱们还发现了另一个问题，也能够进行针对性的优化，就是在咱们的初始化代码当中有些的优先级并非那么高，它能够不放在Application的onCreate中执行，而彻底能够放在以后延迟执行的，由于咱们对这些代码进行了延迟初始化，最后，咱们还结合了idealHandler作了一个更优的延迟初始化的方案，利用它能够在主线程的空闲时间进行初始化，以减小启动耗时致使的卡顿现象。作完这些以后，咱们的启动速度就变得很快了。

最后，我简单说下咱们是怎么长期来保持启动优化的效果的。首先，咱们作了咱们的启动器，而且结合了咱们的CI，在线上加上了不少方面的监控。（引导=> 第4题）

二、是怎么异步的，异步遇到问题没有？

一、体现演进过程
二、详细介绍启动器

咱们最初是采用的普通的一个异步的方案，即new Thread + 设置线程优先级为后台线程的方式在Application的onCreate方法中进行异步初始化，后来，咱们使用了线程池、IntentService的方式，可是，在咱们应用的演进过程中，发现代码会变得不够优雅，而且有些场景很是很差处理，好比说多个初始化任务直接的依赖关系，好比说某一个初始化任务须要在某一个特定的生命周期中初始化完成，这些都是使用线程池、IntentService没法实现的。因此说，咱们就开始思考一个新的解决方案，它可以完美地解决咱们刚刚所遇到的这些问题。

这个方案就是咱们目前所使用的启动器，在启动器的概念中，咱们将每个初始化代码抽象成了一个Task，而后，对它们进行了一个排序，根据它们之间的依赖关系排了一个有向无环图，接着，使用一个异步队列进行执行，而且这个异步队列它和CPU的核心数是强烈相关的，它可以最大程度地保证咱们的主线程和别的线程都可以执行咱们的任务，也就是你们几乎均可以同时完成。

三、启动优化有哪些容易忽略的注意点？

一、cpu time与wall time
二、注意延迟初始化的优化
三、介绍下黑科技

首先，在CPU Profiler和Systrace中有两个很重要的指标，即cpu time与wall time，咱们必须清楚cpu time与wall time之间的区别，wall time指的是代码执行的时间，而cpu time指的是代码消耗CPU的时间，锁冲突会形成二者时间差距过大。咱们须要以cpu time来做为咱们优化的一个方向。

其次，咱们不只只追求启动速度上的一个提高，也须要注意延迟初始化的一个优化，对于延迟初始化，一般的作法是在界面显示以后才去进行加载，可是若是此时界面须要进行滑动等与用户交互的一系列操做，就会有很严重的卡顿现象，所以咱们使用了idealHandler来实现cpu空闲时间来执行耗时任务，这极大地提高了用户的体验，避免了因启动耗时任务而致使的页面卡顿现象。

最后，对于启动优化，还有一些黑科技，首先，就是咱们采用了类预先加载的方式，咱们在MultiDex.install方法以后起了一个线程，而后用Class.forName的方式来预先触发类的加载，而后当咱们这个类真正被使用的时候，就不用再进行类加载的过程了。同时，咱们再看Systrace图的时候，有一部分手机其实并无给咱们应用去跑满cpu，好比说它有8核，可是却只给了咱们4核等这些状况，而后，有些应用对此作了一些黑科技，它会将cpu的核心数以及cpu的频率在启动的时候去进行一个暴力的提高。

四、版本迭代致使的启动变慢有好的解决方式吗？

启动器
结合CI
监控完善

这种问题其实咱们以前也遇到过，这的确很是难以解决。可是，咱们后面对此进行了反复的思考与尝试，终于找到了一个比较好的解决方式。

首先，咱们使用了启动器去管理每个初始化任务，而且启动器中每个任务的执行都是被其自动进行分配的，也就是说这些自动分配的task咱们会尽可能保证它会平均分配在咱们每个线程当中的，这和咱们普通的异步是不同的，它能够很好地缓解咱们应用的启动变慢。

其次，咱们还结合了CI，好比说，咱们如今限制了一些类，如Application，若是有人修改了它，咱们不会让这部分代码合并到主干分支或者是修改以后会有一些内部的工具如邮件的形式发送到我，而后，我就会和他确认他加的这些代码究竟是耗时多少，可否异步初始化，不能异步的话就考虑延迟初始化，若是初始化时间太长，则能够考虑是否能进行懒加载，等用到的时候再去使用等等。

而后，咱们会将问题尽量地暴露在上线以前。同时，咱们真正已经到了线上的一个环境下时，咱们进行了监控的一个完善，咱们不只是监控了App的整个的启动时间，同时呢，咱们也将每个生命周期都进行了一个监控。好比说Application的onCreate与onAttachBaseContext方法的耗时，以及这两个生命周期之间间隔的时间，咱们都进行了一个监控，若是说下一次咱们发现了这个启动速度变慢了，咱们就能够去查找究竟是哪个环节变慢了，咱们会和之前的版本进行对比，对比完成以后呢，咱们就能够来找这一段新加的代码。

7、总结

一、优化总方针

异步、延迟、懒加载
技术、业务相结合

二、注意事项

一、cpu time 和 wall time

wall time（代码执行时间）与cpu time（代码消耗CPU时间），锁冲突会形成这二者时间差距过大。
cpu time才是优化方向，应尽力按照systrace的cpu time和wall time跑满cpu。

二、监控的完善

线上监控多阶段时间（App、Activity、生命周期间隔时间）。
处理聚合看趋势。
收敛启动代码修改权限。
结合CI修改启动代码须要Review通知。

至此，探索Android启动速度优化的旅途也应该告一段落了，若是你耐心读到最后的话，会发现要想极致地提高App的性能，须要有必定的技术广度，如咱们引入了始于后端的AOP编程来实现无侵入式的函数插桩，也须要有必定的深度，从前面的探索之旅来看，咱们前后涉及了Framework层、Native层、Dalvik虚拟机、甚至是Linux IO和文件系统相关的原理。所以，我想说，Android开发并不简单，即便是App层面的性能优化这一知识体系，也是须要咱们不断地加深自身知识的深度和广度。

ps：在文章的黑科技部分涉及到了许多基础架构研发领域的知识，这部分没法理解的同窗不要灰心，先了解便可，
    笔者以后的文章都会一一详细讲解。
复制代码

参考连接：

一、Android开发高手课之启动优化

二、支付宝客户端架构解析：Android 客户端启动速度优化之「垃圾回收」

三、支付宝 App 构建优化解析：经过安装包重排布优化 Android 端启动性能

四、Facebook Redex字节码优化工具

五、微信Android热补丁实践演进之路

六、安卓App热补丁动态修复技术介绍

七、Dalvik Optimization and Verification With dexopt

八、微信在Github开源了Hardcoder，对Android开发者有什么影响？

九、历时三年研发，OPPO 的 Hyper Boost 引擎如何对系统、游戏和应用实现加速？

十、抱歉，Xposed真的能够随心所欲

十一、墙上时钟时间，用户cpu时间，系统cpu时间的理解

十二、《Android应用性能优化最佳实践》

1三、必知必会 | Android 性能优化的方面方面都在这儿

1四、极客时间之Top团队大牛带你玩转Android性能分析与优化

1五、启动器源码

1六、MultiDex优化源码

1七、使用gradle自动化增长Trace Tag

Contanct Me

● 微信：

欢迎关注个人微信：bcce5360

● 微信群：

微信群若是不能扫码加入，麻烦你们想进微信群的朋友们，加我微信拉你进群。

● QQ群：

2千人QQ群，Awesome-Android学习交流群，QQ群号：959936182，欢迎你们加入~