title: 深刻探索Android卡顿优化(上)
date: 2020/1/26 20:12:00
tags:
- 性能优化
categories: 性能优化
thumbnail: https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1557665970516&di=b58d306a0db07efca58f8c9b655f5c13&imgtype=0&src=http%3A%2F%2Fimg02.tooopen.com%2Fimages%2F20160520%2Ftooopen_sl_055418231108.jpg
复制代码
在上篇,笔者详细分析了目前的App绘制与布局优化的相关优化方案,若是对绘制优化与布局优化还不是很是熟悉的能够仔细看看前几篇文章:Android性能优化之绘制优化、深刻探索Android布局优化(上)、深刻探索Android布局优化(下)。因为卡顿优化这一主题包含的内容太多,为了更详细地进行讲解,所以,笔者将它分为了上、下两篇。本篇,即为《深刻探索Android卡顿优化》的上篇。本篇包含的主要内容以下所示:html
在咱们使用各类各样的App的时候,有时会看见有些App运行起来并不流畅,即出现了卡顿现象,那么如何去定义发生了卡顿现象呢?java
若是App的FPS平均值小于30,最小值小于24,即代表应用发生了卡顿。
复制代码
那我么又如何去分析应用是否出现了卡顿呢?下面,咱们就先来了解一下解决卡顿问题时须要用到的分析方法与工具。python
尽管形成卡顿的缘由有不少种,不过最终都会反映到CPU时间上。linux
CPU时间包含用户时间和系统时间。android
CPU的问题大体能够分为如下三类:git
一、CPU资源冗余使用github
二、CPU资源争抢web
三、CPU资源利用率低算法
对于启动、界面切换、音视频编解码这些场景,为了保证其速度,咱们须要去好好利用CPU。而致使没法充分利用CPU的因素,不只有磁盘和网络I/O,还有锁操做、sleep等等。对于锁的优化,一般是尽量地缩减锁的范围。shell
咱们能够经过CPU的主频、核心数、缓存等参数去评估CPU的性能,这些参数的好坏能表现出CPU计算能力和指令执行能力的强弱,也就是CPU每秒执行的浮点计算数和每秒执行的指令数的多少。
此外,如今最新的主流机型都使用了多级能效的CPU架构(即多核分层架构),以确保在日常低负荷工做时能仅使用低频核心来节省电量。
而且,咱们还能够经过shell命令直接查看手机的CPU核心数与频率等信息,以下所示:
// 先输入adb shell进入手机的shell环境
adb shell
// 获取 CPU 核心数,个人手机是8核
platina:/ $ cat /sys/devices/system/cpu/possible
0-7
// 获取第一个 CPU 的最大频率
platina:/ $ cat
/sys/devices/system/cpu/cpu0/cpufreq/cpuinfo_max_freq <
1843200
// 获取第二个CPU的最小频率
platina:/ $ cat
/sys/devices/system/cpu/cpu1/cpufreq/cpuinfo_min_freq <
633600
复制代码
从 CPU 到 GPU 再到 AI 芯片(如专为神经网络计算打造的 NPU(Neural network Processing Unit)),随着手机 CPU 总体性能的飞跃,医疗诊断、图像超清化等一些 AI 应用场景也能够在移动端更好地落地。咱们能够充分利用移动端的计算能力来下降高昂的服务器成本。
此外,CPU的性能越好,应用就能得到更好的支持,如线程池能够根据不一样手机的CPU核心数来配备不一样的线程数、仅在手机主频比较高或者带有NPU的设备去开启一些高级的AI功能。
当应用出现卡顿问题以后,首先咱们应该查看系统CPU的使用率。
首先,咱们经过读取 /proc/stat 文件获取总的 CPU 时间,并读取 /proc/[PID]/stat 获取应用进程 的CPU 时间,而后,采样两个足够短的时间间隔的 CPU 快照与进程快照来计算其 CPU 使用率。
一、采样两个足够短的时间间隔的 CPU 快照,即须要先后两次去读取 /proc/stat 文件,获取两个时间点对应的数据,以下所示:
// 第一次采样
platina:/ $ cat /proc/stat
cpu 9931551 1082101 9002534 174463041 340947 1060438 1088978 0 0 0
cpu0 2244962 280573 2667000 22414199 99651 231869 439918 0 0 0
cpu1 2672378 421880 2943791 21540302 121818 236850 438733 0 0 0
cpu2 1648512 76856 1431036 25868789 46970 107094 52025 0 0 0
cpu3 1418757 41280 1397203 25772984 40292 110168 41667 0 0 0
cpu4 573203 79498 178263 19618235 9577 307949 10875 0 0 0
cpu5 522638 67978 155454 19684358 8793 19787 4603 0 0 0
cpu6 458438 64085 132252 19749439 8143 19942 98241 0 0 0
cpu7 392663 49951 97535 19814735 5703 26779 2916 0 0 0
intr...
// 第二次采样
platina:/ $ cat /proc/stat
cpu 9931673 1082113 9002679 174466561 340954 1060446 1088994 0 0 0
cpu0 2244999 280578 2667032 22414604 99653 231869 439918 0 0 0
cpu1 2672434 421881 2943861 21540606 121822 236855 438747 0 0 0
cpu2 1648525 76859 1431054 25869234 46971 107095 52026 0 0 0
cpu3 1418773 41283 1397228 25773412 40292 110170 41668 0 0 0
cpu4 573203 79498 178263 19618720 9577 307949 10875 0 0 0
cpu5 522638 67978 155454 19684842 8793 19787 4603 0 0 0
cpu6 458438 64085 132252 19749923 8143 19942 98241 0 0 0
cpu7 392663 49951 97535 19815220 5703 26779 2916 0 0 0
int...
复制代码
由于个人手机是8核,因此这里的cpu个数是8个,从cpu0到cpu7,第一行的cpu便是8个cpu的指标数据汇总,由于是要计算系统cpu的使用率,那固然应该以cpu为基准了。两次采样的CPU指标数据以下:
cpu1 9931551 1082101 9002534 174463041 340947 1060438 1088978 0 0 0
cpu2 9931673 1082113 9002679 174466561 340954 1060446 1088994 0 0 0
复制代码
其对应的各项指标以下:
CPU (user, nice, system, idle, iowait, irq, softirq, stealstolen, guest);
复制代码
拿cpu1(9931551 1082101 9002534 174463041 340947 1060438 1088978 0 0 0)的数据来讲,下面,我就来详细地解释下这些指标的含义。
此外,这些数值的单位都是 jiffies,jiffies 是内核中的一个全局变量,用来记录系统启动以来产生的节拍数,在 Linux 中,一个节拍大体能够理解为操做系统进程调度的最小时间片,不一样的 Linux 系统内核中的这个值可能不一样,一般在 1ms 到 10ms 之间。
了解了/proc/stat命令下各项参数的含义以后,咱们就能够由先后两次时间点的CPU数据计算获得cpu1与cpu2的活动时间,以下所示:
totalCPUTime = user + nice + system + idle + iowait + irq + softirq + stealstolen + guest
cpu1 = 9931551 + 1082101 + 9002534 + 174463041 + 340947 + 1060438 + 1088978 + 0 + 0 + 0 = 196969590jiffies
cpu2 = 9931673 + 1082113 + 9002679 + 174466561 + 340954 + 1060446 + 1088994 + 0 + 0 + 0 = 196973420jiffies
复制代码
所以可得出总的CPU时间,以下所示:
totalCPUTime = CPU2 – CPU1 = 3830jiffies
复制代码
最后,咱们就能够计算出系统CPU的使用率::
// 先计算获得CPU的空闲时间
idleCPUTime = idle2 – idle1 = 3520jiffies
// 最后获得系统CPU的使用率
totalCPUUse = (totalCPUTime – idleCPUTime) / totalCPUTime = (3830 - 3520)/ 3830 = 8%
复制代码
能够看到,先后两次时间点间的CPU使用率大概为8%,说明咱们系统的CPU是处于空闲状态的,若是CPU 使用率一直大于 60% ,则表示系统处于繁忙状态,此时就须要进一步分析用户时间和系统时间的比例,看看究竟是系统占用了CPU仍是应用进程占用了CPU。
此外,因为Android是基于Linux内核改造而成的操做系统,天然而然也能使用Linux的一些经常使用命令。好比咱们可使用top命令查看哪些进程是 CPU 的主要消耗者。
// 直接使用top命令会定时不断地输出进程的相关信息
1|platina:/ $ top
PID USER PR NI VIRT RES SHR S[%CPU] %MEM TIME+ ARGS
12700 u0_a945 10 -10 4.3G 122M 67M S 15.6 2.1 1:06.41 json.chao.com.w+
753 system RT 0 90M 1.1M 1.0M S 13.6 0.0 127:47.73 android.hardwar+
2064 system 18 -2 4.6G 309M 215M S 12.3 5.4 978:15.18 system_server
22142 u0_a163 20 0 2.0G 97M 41M S 10.3 1.6 2:22.99 com.tencent.mob+
2293 system 20 0 4.7G 250M 87M S 8.6 4.3 353:15.77 com.android.sys+
复制代码
从以上可知咱们的Awesome-WanAndroid应用进程占用了15.6%的CPU。最后,这里再列举下最经常使用的top命令,以下所示:
// 排除0%的进程信息
adb shell top | grep -v '0% S'
// 只打印1次按CPU排序的TOP 10的进程信息
adb shell top -m 10 -s cpu -n 1
|platina:/ $ top -d 1|grep json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 13.8 2.2 1:04.46 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 19.0 2.2 1:04.51 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 15.0 2.2 1:04.70 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 9.0 2.2 1:04.85 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 26.0 2.2 1:04.94 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 9.0 2.2 1:05.20 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M R 17.0 2.2 1:05.29 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 20.0 2.2 1:05.46 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 9.0 2.2 1:05.66 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M R 21.0 2.2 1:05.75 json.chao.com.w+
5689 u0_a945 10 -10 4.3G 129M 71M S 14.0 2.2 1:05.96 json.chao.com.w+
复制代码
除了top命令能够比较全面地查看总体的CPU信息以外,若是咱们只想查看当前指定进程已经消耗的CPU时间占系统总时间的百分比或其它的状态信息的话,可使用ps命令,经常使用的ps命令以下所示:
// 查看指定进程的状态信息
platina:/ $ ps -p 31333
USER PID PPID VSZ RSS WCHAN ADDR S NAME
u0_a945 31333 1277 4521308 127460 0 0 S json.chao.com.w+
// 查看指定进程已经消耗的CPU时间占系统总时间的百分比
platina:/ $ ps -o PCPU -p 31333
%CPU
10.8
复制代码
其中输出参数的含义以下所示:
最后的输出参数S表示的是进程当前的状态,总共有10种可能的状态,以下所示:
R (running) S (sleeping) D (device I/O) T (stopped) t (traced)
Z (zombie) X (deader) x (dead) K (wakekill) W (waking)
复制代码
能够看到,咱们当前主进程是休眠的状态。
使用dumpsys cpuinfo命令得到的信息比起top命令获得的信息要更加精炼,以下所示:
platina:/ $ dumpsys cpuinfo
Load: 1.92 / 1.59 / 0.97
CPU usage from 45482ms to 25373ms ago (2020-02-04 17:00:37.666 to 2020-02-04 17:00:57.775):
33% 2060/system_server: 22% user + 10% kernel / faults: 8152 minor 6 major
17% 2292/com.android.systemui: 12% user + 4.7% kernel / faults: 21636 minor 3 major
14% 750/android.hardware.sensors@1.0-service: 4.4% user + 10% kernel
6.1% 778/surfaceflinger: 3.3% user + 2.7% kernel / faults: 128 minor
3.3% 2598/com.miui.home: 2.8% user + 0.4% kernel / faults: 7655 minor 11 major
2.2% 2914/cnss_diag: 1.6% user + 0.6% kernel
1.9% 745/android.hardware.graphics.composer@2.1-service: 1.4% user + 0.5% kernel / faults: 5 minor
1.7% 4525/kworker/u16:6: 0% user + 1.7% kernel
1.6% 748/android.hardware.memtrack@1.0-service: 0.6% user + 0.9% kernel
1.4% 4551/kworker/u16:14: 0% user + 1.4% kernel
1.4% 31333/json.chao.com.wanandroid: 0.9% user + 0.4% kernel / faults: 3995 minor 22 major
1.1% 6670/kworker/u16:0: 0% user + 1.1% kernel
0.9% 448/mmc-cmdqd/0: 0% user + 0.9% kernel
0.7% 95/system: 0% user + 0.7% kernel
0.6% 4512/mdss_fb0: 0% user + 0.6% kernel
0.6% 7393/com.android.incallui: 0.6% user + 0% kernel / faults: 2272 minor
0.6% 594/logd: 0.4% user + 0.1% kernel / faults: 38 minor 3 major
0.5% 3108/com.xiaomi.xmsf: 0.2% user + 0.2% kernel / faults: 1812 minor
0.5% 4526/kworker/u16:9: 0% user + 0.5% kernel
0.5% 4621/com.gotokeep.keep: 0.3% user + 0.1% kernel / faults: 55 minor
0.5% 354/irq/267-NVT-ts: 0% user + 0.5% kernel
0.5% 2572/com.android.phone: 0.3% user + 0.1% kernel / faults: 323 minor
0.5% 4554/kworker/u16:15: 0% user + 0.5% kernel
0.4% 290/kgsl_worker_thr: 0% user + 0.4% kernel
0.3% 2933/irq/61-1008000.: 0% user + 0.3% kernel
0.3% 3932/com.tencent.mm: 0.2% user + 0% kernel / faults: 647 minor 1 major
0.3% 4550/kworker/u16:13: 0% user + 0.3% kernel
0.3% 744/android.hardware.graphics.allocator@2.0-service: 0% user + 0.3% kernel / faults: 48 minor
0.3% 8906/com.tencent.mm:appbrand0: 0.2% user + 0% kernel / faults: 45 minor
0.2% 79/smem_native_rpm: 0% user + 0.2% kernel
0.2% 759/vendor.qti.hardware.perf@1.0-service: 0% user + 0.2% kernel / faults: 46 minor
0.2% 3197/com.miui.powerkeeper: 0% user + 0.1% kernel / faults: 141 minor
0.2% 4489/kworker/1:1: 0% user + 0.2% kernel
0.2% 595/servicemanager: 0% user + 0.2% kernel
0.2% 754/android.hardware.wifi@1.0-service: 0.1% user + 0% kernel
0.2% 1258/jbd2/dm-2-8: 0% user + 0.2% kernel
0.2% 5800/com.eg.android.AlipayGphone: 0.1% user + 0% kernel / faults: 48 minor
0.2% 21590/iptables-restore: 0% user + 0.1% kernel / faults: 563 minor
0.2% 21592/ip6tables-restore: 0% user + 0.1% kernel / faults: 647 minor
0.1% 3/ksoftirqd/0: 0% user + 0.1% kernel
0.1% 442/cfinteractive: 0% user + 0.1% kernel
0.1% 568/ueventd: 0% user + 0% kernel
0.1% 1295/netd: 0% user + 0.1% kernel / faults: 250 minor
0.1% 3002/com.miui.securitycenter.remote: 0.1% user + 0% kernel / faults: 818 minor 1 major
0.1% 20555/com.eg.android.AlipayGphone:push: 0% user + 0% kernel / faults: 20 minor
0.1% 7/rcu_preempt: 0% user + 0.1% kernel
0.1% 15/ksoftirqd/1: 0% user + 0.1% kernel
0.1% 76/lpass_smem_glin: 0% user + 0.1% kernel
0.1% 1299/rild: 0.1% user + 0% kernel / faults: 12 minor
0.1% 1448/android.process.acore: 0.1% user + 0% kernel / faults: 1719 minor
0% 4419/com.google.android.webview:s: 0% user + 0% kernel / faults: 602 minor
0% 20465/com.miui.hybrid: 0% user + 0% kernel / faults: 1575 minor
0% 10/rcuop/0: 0% user + 0% kernel
0% 75/smem_native_lpa: 0% user + 0% kernel
0% 90/kcompactd0: 0% user + 0% kernel
0% 1508/msm_irqbalance: 0% user + 0% kernel
0% 1745/cds_mc_thread: 0% user + 0% kernel
0% 2899/charge_logger: 0% user + 0% kernel
0% 3612/com.tencent.mm:tools: 0% user + 0% kernel / faults: 29 minor
0% 4203/kworker/0:0: 0% user + 0% kernel
0% 7377/com.android.server.telecom:ui: 0% user + 0% kernel / faults: 1083 minor
0% 32113/com.tencent.mobileqq: 0% user + 0% kernel / faults: 49 minor
0% 8/rcu_sched: 0% user + 0% kernel
0% 22/ksoftirqd/2: 0% user + 0% kernel
0% 25/rcuop/2: 0% user + 0% kernel
0% 29/ksoftirqd/3: 0% user + 0% kernel
0% 39/rcuop/4: 0% user + 0% kernel
0% 53/rcuop/6: 0% user + 0% kernel
0% 487/irq/715-ima-rdy: 0% user + 0% kernel
0% 749/android.hardware.power@1.0-service: 0% user + 0% kernel
0% 764/healthd: 0% user + 0% kernel / faults: 2 minor
0% 845/wlan_logging_th: 0% user + 0% kernel
0% 860/mm-pp-dpps: 0% user + 0% kernel
0% 1297/wificond: 0% user + 0% kernel / faults: 12 minor
0% 1309/com.miui.weather2: 0% user + 0% kernel / faults: 729 minor 23 major
0% 1542/rild: 0% user + 0% kernel / faults: 3 minor
0% 2915/tcpdump: 0% user + 0% kernel / faults: 6 minor
0% 2974/com.tencent.mobileqq:MSF: 0% user + 0% kernel / faults: 121 minor
0% 3044/com.miui.contentcatcher: 0% user + 0% kernel / faults: 315 minor
0% 3057/com.miui.dmregservice: 0% user + 0% kernel / faults: 332 minor
0% 3095/com.xiaomi.mircs: 0% user + 0% kernel
0% 3115/com.xiaomi.finddevice: 0% user + 0% kernel / faults: 270 minor 3 major
0% 3513/com.xiaomi.metoknlp: 0% user + 0% kernel / faults: 136 minor
0% 3603/com.tencent.mm:toolsmp: 0% user + 0% kernel / faults: 35 minor
0% 4527/kworker/u16:11: 0% user + 0% kernel
0% 4841/com.gotokeep.keep:xg_service_v4: 0% user + 0% kernel / faults: 275 minor
0% 5064/com.sohu.inputmethod.sogou.xiaomi: 0% user + 0% kernel / faults: 102 minor
0% 5257/kworker/0:1: 0% user + 0% kernel
0% 5839/com.tencent.mm:push: 0% user + 0% kernel / faults: 98 minor
0% 6644/kworker/3:2: 0% user + 0% kernel
0% 6657/com.miui.wmsvc: 0% user + 0% kernel / faults: 52 minor
0% 6945/com.xiaomi.account:accountservice: 0% user + 0% kernel / faults: 1 minor
0% 9387/com.tencent.mm:appbrand1: 0% user + 0% kernel / faults: 27 minor
13% TOTAL: 6.8% user + 5.3% kernel + 0.2% iowait + 0.3% irq + 0.4% softirq
复制代码
从上述信息可知,第一行显示的是cpuload (负载平均值)信息:Load: 1.92 / 1.59 / 0.97 这三个数字表示逐渐变长的时间段(平均一分钟,五分钟和十五分钟)的平均值,而较低的数字则更好。数字越大表示有问题或机器过载。须要注意的是,这里的Load须要除以核心数,好比我这里的系统核心数为8核,因此最终每个单核CPU的Load为0.24 / 0.20 / 0.12,若是Load超过1,则表示出现了问题。
此外,占用系统CPU资源最高的是system_server进程,而咱们的wanandroid应用进程仅占用了 1.4%的CPU资源,其中有0.9%的是用户态所占用的时间,0.4%是内核态所占用的时间。最后,咱们能够看到系统总占用的CPU时间是13%,这个值是根据前面全部值加起来 / 系统CPU数的处理的,也就是104% / 8 = 13%。
除了上述方式来分析系统与应用的CPU使用状况以外,咱们还应该关注卡顿率与卡顿树这两个指标。它们能帮助咱们有效地去评估、而且更有针对性地去优化应用发生的卡顿。
相似于深刻探索Android稳定性优化一文中讲到的UV、PV崩溃率,卡顿也能够有其对应的UV、PV卡顿率,UV就是Unique visitor,指的就是一台手机客户端为一个访客,00:00-24:00内相同的客户端只被计算一次。而PV即Page View,即页面浏览量或点击量。因此UV、PV卡顿率的定义即为以下所示:
// UV 卡顿率能够评估卡顿的影响范围
UV 卡顿率 = 发生过卡顿 UV / 开启卡顿采集 UV
// PV 卡顿率评估卡顿的严重程度
PV 卡顿率 = 发生过卡顿 PV / 启动采集 PV
复制代码
由于卡顿问题的采样规则跟内存问题是类似的,通常都是采起抽样上报的方式,而且都应该按照单个用户来抽样。一个用户若是命中采集,那么在一天内都会持续的采集数据。
咱们能够实现卡顿的火焰图,即卡顿树,在一张图里就能够看到卡顿的总体信息。因为卡顿的具体耗时跟手机性能,还有当时的使用场景、环境等密切相关,并且卡顿问题在日活大的应用上出现的场景很是多,因此对于大于咱们指定的卡顿阈值如1s\2s\3s时,咱们就能够抛弃具体的耗时,只按照相同堆栈出现的比例来聚合各种卡顿信息。这样咱们就可以很直观地从卡顿树上看到到底哪些堆栈出现的卡顿问题最多,以便于咱们可以优先去解决 Top 的卡顿问题,达到使用最少的精力获取最大的优化效果的目的。
CPU Profiler的使用笔者已经在深刻探索Android启动速度优化中详细分析过了,若是对CPU Profiler还不是很熟悉的话,能够去看看这篇文章。
下面咱们来简单来回顾一下CPU Profiler。
运行时开销严重,总体都会变慢,可能会带偏咱们的优化方向。
Debug.startMethodTracing("");
// 须要检测的代码片断
...
Debug.stopMethodTracing();
复制代码
最终生成的生成文件在sd卡:Android/data/packagename/files。
systrace 利用了 Linux 的ftrace调试工具(ftrace是用于了解Linux内核内部运行状况的调试工具),至关于在系统各个关键位置都添加了一些性能探针,也就是在代码里加了一些性能监控的埋点。Android 在 ftrace 的基础上封装了atrace,并增长了更多特有的探针,好比Graphics、Activity Manager、Dalvik VM、System Server 等等。对于Systrace的使用笔者在深刻探索Android启动速度优化这篇文章中已经详细分析过了,若是对Systrace还不是很熟悉的话能够去看看这篇文章。
下面咱们来简单回顾一下Systrace。
监控和跟踪API调用、线程运行状况,生成HTML报告。
API 18以上使用,推荐使用TraceCompat。
使用python命令执行脚本,后面加上一系列参数,以下所示:
python systrace.py -t 10 [other-options] [categories]
// 笔者一般使用的systrace配置
python /Users/quchao/Library/Android/sdk/platform-tools/systrace/systrace.py -t 20 sched gfx view wm am app webview -a "com.wanandroid.json.chao" -o ~/Documents/open-project/systrace_data/wanandroid_start_1.html
复制代码
具体参数含义以下:
最后,咱们还能够经过编译时给每一个函数插桩的方式来实现线下自动增长应用程序的耗时分析,可是要注意需过滤大部分的短函数,以减小性能损耗(这一点能够经过黑名单配置的方式去过滤短函数或调用很是频繁的函数)。使用这种方式咱们就能够看到整个应用程序的调用流程。包括应用关键线程的函数调用,例如渲染耗时、线程锁,GC 耗时等等。这里可使用zhengcx的MethodTraceMan,可是目前仅仅能实现对包名和类名的过滤配置,因此须要对源码进行定制化,以支持过滤短函数或调用很是频繁函数的配置功能。
基于性能的考虑,若是要在线上使用此方案,最好只去监控主线程的耗时。虽然插桩方案对性能的影响并非很大,可是建议仅在线下或灰度环境中使用。
此外,若是你须要分析Native 函数的调用,请使用Android 5.0 新增的Simpleperf性能分析工具,它利用了 CPU 的性能监控单元(PMU)提供的硬件 perf 事件。使用 Simpleperf 能够看到全部的 Native 代码的耗时,对一些 Android 系统库的调用,在分析问题时有比较大的帮助,例如分析加载 dex、verify class 的耗时等等。此外,在 Android Studio 3.2 中的 Profiler 也直接支持了 Simpleper(SampleNative性能分析工具 (API Level 26+)),这更加方便了native代码的调试。
StrictMode是Android 2.3引入的一个工具类,它被称为严苛模式,是Android提供的一种运行时检测机制,能够用来帮助开发人员用来检测代码中一些不规范的问题。对于咱们的项目当中,可能会成千上万行代码,若是咱们用肉眼Review,这样不只效率很是低效,并且比较容易出问题。使用StrictMode以后,系统会自动检测出来在主线程中的一些异常状况,并按照咱们的配置给出相应的反应。
StrictMode这个工具是很是强大的,可是咱们可能由于对它不熟悉而忽略掉它。StrictMode主要用来检测两大问题:
线程策略的检测内容,是一些自定义的耗时调用、磁盘读取操做以及网络请求等。
虚拟机策略的检测内容以下:
若是要在应用中使用StrictMode,只须要在Applicaitoin的onCreate方法中对StrictMode进行统一配置,代码以下所示:
private void initStrictMode() {
// 一、设置Debug标志位,仅仅在线下环境才使用StrictMode
if (DEV_MODE) {
// 二、设置线程策略
StrictMode.setThreadPolicy(new StrictMode.ThreadPolicy.Builder()
.detectCustomSlowCalls() //API等级11,使用StrictMode.noteSlowCode
.detectDiskReads()
.detectDiskWrites()
.detectNetwork() // or .detectAll() for all detectable problems
.penaltyLog() //在Logcat 中打印违规异常信息
// .penaltyDialog() //也能够直接跳出警报dialog
// .penaltyDeath() //或者直接崩溃
.build());
// 三、设置虚拟机策略
StrictMode.setVmPolicy(new StrictMode.VmPolicy.Builder()
.detectLeakedSqlLiteObjects()
// 给NewsItem对象的实例数量限制为1
.setClassInstanceLimit(NewsItem.class, 1)
.detectLeakedClosableObjects() //API等级11
.penaltyLog()
.build());
}
}
复制代码
最后,在日志输出栏中注意使用“StrictMode”关键字过滤出对应的log便可。
Profilo是一个用于收集应用程序生产版本的性能跟踪的Android库。
对于Profilo来讲,它集成了atrace功能,ftrace 全部的性能埋点数据都会经过 trace_marker 文件写入到内核缓冲区,Profilo 使用了 PLT Hook 拦截了写入操做,以选择部分关心的事件去作特定的分析。这样全部的 systrace 的探针咱们均可以拿到,例如四大组件生命周期、锁等待时间、类校验、GC 时间等等。不过大部分的 atrace 事件都比较笼统,从事件“B|pid|activityStart”,咱们没法明确知道该事件具体是由哪一个 Activity 来建立的。
此外,使用Profilo还可以快速获取Java堆栈。因为获取堆栈须要暂停主线程的运行,因此profilo经过间隔发送 SIGPROF 信号这样一种相似 Native 崩溃捕捉的方式去快速获取 Java 堆栈。
Profilo可以低耗时地快速获取Java堆栈的具体实现原理为当Signal Handler 捕获到信号后,它就会获取到当前正在执行的 Thread,经过 Thread 对象就能够拿到当前线程的 ManagedStack,ManagedStack 是一个单链表,它保存了当前的 ShadowFrame 或者 QuickFrame 栈指针,先依次遍历 ManagedStack 链表,而后遍历其内部的 ShadowFrame 或者 QuickFrame 还原一个可读的调用栈,从而 unwind 出当前的 Java 堆栈。关于ManagedStack与ShadowFrame、QuickFrame三者的关系以下图所示:
Profilo经过这种方式,就能够实现线程同步运行的同时,咱们还能够去帮它作检查,而且耗时基本能够忽略不计。可是目前 Profilo 快速获取堆栈的功能不支持 Android 8.0 和 Android 9.0,而且它内部使用了Hook等大量的黑科技手段,鉴于稳定性问题,建议采起抽样部分用户的方式来开启该功能。
前面咱们说过,Profilo最终也使用了ftrace,而Systrace主要也是根据Linux的ftrace机制来实现的,而ftrace的做用是帮助咱们了解 Linux 内核的运行时行为,以便进行故障调试或性能分析。ftrace的总体架构以下所示:
由上图可知,Ftrace 有两大组成部分,一个是 framework,另外就是一系列的 tracer 。每一个 tracer 用于完成不一样的功能,而且它们统一由 framework 管理。 ftrace 的 trace 信息保存在 ring buffer 中,由 framework 负责管理。 Framework 利用 debugfs 系统在 /debugfs 下创建 tracing 目录,并提供了一系列的控制文件。
下面,我这里给出使用 PLTHook 技术来获取 Atrace 日志的一个项目。
使用 PLTHook 技术来获取 Atrace 的日志-项目地址
运行项目后,咱们点击按钮开启Atrace日志,而后就能够在Logcat中看到以下的native层日志信息:
2020-02-05 10:58:00.873 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ===============install systrace hoook==================
2020-02-05 10:58:00.879 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|inflate
2020-02-05 10:58:00.880 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|LinearLayout
2020-02-05 10:58:00.881 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.882 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|TextView
2020-02-05 10:58:00.884 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.885 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.888 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|notifyFramePending
2020-02-05 10:58:00.888 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.889 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|Choreographer#doFrame
2020-02-05 10:58:00.889 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|input
2020-02-05 10:58:00.889 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.889 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|traversal
2020-02-05 10:58:00.889 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|draw
2020-02-05 10:58:00.890 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|Record View#draw()
2020-02-05 10:58:00.891 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|DrawFrame
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|syncFrameState
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|prepareTree
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
2020-02-05 10:58:00.891 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
2020-02-05 10:58:00.891 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13052/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|setBuffersDimensions
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.892 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|dequeueBuffer
2020-02-05 10:58:00.894 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|importBuffer
2020-02-05 10:58:00.894 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|HIDL::IMapper::importBuffer::passthrough
2020-02-05 10:58:00.894 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.894 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.894 13052-13058/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|Compiling
2020-02-05 10:58:00.894 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= E
2020-02-05 10:58:00.894 13052-13075/com.dodola.atrace I/HOOOOOOOOK: ========= B|13052|query
复制代码
须要注意的是,日志中的B表明begin,也就是对应时间开始的时间,而E表明End,即对应事件结束的时间,而且,B|事件和E|事件是成对出现的,这样咱们就能够经过该事件的结束时间减去对应的开始时间来得到每一个事件使用的时间。例如,上述log中咱们能够看出TextView的draw方法显示使用了3ms。
此外,在下面这个项目里展现了如何使用 PLTHook 技术来获取线程建立的堆栈。
运行项目后,咱们点击开启 Thread Hook按钮,而后点击新建 Thread按钮。最后能够在Logcat 中看到Thread建立的堆栈信息:
2020-02-05 13:47:59.006 20159-20159/com.dodola.thread E/HOOOOOOOOK: stack:com.dodola.thread.ThreadHook.getStack(ThreadHook.java:16)
com.dodola.thread.MainActivity$2.onClick(MainActivity.java:40)
android.view.View.performClick(View.java:6311)
android.view.View$PerformClick.run(View.java:24833)
android.os.Handler.handleCallback(Handler.java:794)
android.os.Handler.dispatchMessage(Handler.java:99)
android.os.Looper.loop(Looper.java:173)
android.app.ActivityThread.main(ActivityThread.java:6653)
java.lang.reflect.Method.invoke(Native Method)
com.android.internal.os.RuntimeInit$MethodAndArgsCaller.run(RuntimeInit.java:547)
com.android.internal.os.ZygoteInit.main(ZygoteInit.java:821)
2020-02-05 13:47:59.007 20159-20339/com.dodola.thread E/HOOOOOOOOK: thread name:Thread-2
2020-02-05 13:47:59.008 20159-20339/com.dodola.thread E/HOOOOOOOOK: thread id:1057
2020-02-05 13:47:59.009 20159-20339/com.dodola.thread E/HOOOOOOOOK: stack:com.dodola.thread.ThreadHook.getStack(ThreadHook.java:16)
com.dodola.thread.MainActivity$2$1.run(MainActivity.java:38)
2020-02-05 13:47:59.011 20159-20340/com.dodola.thread E/HOOOOOOOOK: inner thread name:Thread-3
2020-02-05 13:47:59.012 20159-20340/com.dodola.thread E/HOOOOOOOOK: inner thread id:1058
复制代码
因为Profilo与PLT Hook涉及了大量的C/C++、NDK开发的知识,限于篇幅,因此这部分不作详细讲解,如对NDK开发感兴趣的同窗能够期待下我后面的Awesome-Android-NDK系列文章,等性能优化系列文章更新完毕以后,就会开始去系统地学习NDK相关的开发知识,敬请期待。
主要有一下两点缘由:
它的原理源于Android的消息处理机制,一个线程无论有多少Handler,它只会有一个Looper存在,主线程执行的任何代码都会经过Looper.loop()方法执行。而在Looper函数中,它有一个mLogging对象,这个对象在每一个message处理先后都会被调用。主线程发生了卡顿,那必定是在dispatchMessage()方法中执行了耗时操做。那么,咱们就能够经过这个mLogging对象对dispatchMessage()进行监控。
首先,咱们看下Looper用于执行消息循环的loop()方法,关键代码以下所示:
/**
* Run the message queue in this thread. Be sure to call
* {@link #quit()} to end the loop.
*/
public static void loop() {
...
for (;;) {
Message msg = queue.next(); // might block
if (msg == null) {
// No message indicates that the message queue is quitting.
return;
}
// This must be in a local variable, in case a UI event sets the logger
final Printer logging = me.mLogging;
if (logging != null) {
// 1
logging.println(">>>>> Dispatching to " + msg.target + " " +
msg.callback + ": " + msg.what);
}
...
try {
// 2
msg.target.dispatchMessage(msg);
dispatchEnd = needEndTime ? SystemClock.uptimeMillis() : 0;
} finally {
if (traceTag != 0) {
Trace.traceEnd(traceTag);
}
}
...
if (logging != null) {
// 3
logging.println("<<<<< Finished to " + msg.target + " " + msg.callback);
}
复制代码
在Looper的loop()方法中,在其执行每个消息(注释2处)的先后都由logging进行了一次打印输出。能够看到,在执行消息前是输出的">>>>> Dispatching to ",在执行消息后是输出的"<<<<< Finished to ",它们打印的日志是不同的,咱们就能够由此来判断消息执行的先后时间点。
因此,具体的实现能够概括为以下步骤:
它是一个非侵入式的性能监控组件,能够经过通知的形式弹出卡顿信息。它的原理就是咱们刚刚讲述到的卡顿监控的实现原理。
接下咱们经过一个简单的示例来说解一下它的使用。
首先,咱们须要在moudle的build.gradle下配置它的依赖,以下所示:
// release:项目中实现了线上监控体系的时候去使用
api 'com.github.markzhai:blockcanary-android:1.5.0'
// 仅在debug包启用BlockCanary进行卡顿监控和提示的话,能够这么用
debugApi 'com.github.markzhai:blockcanary-android:1.5.0'
releaseApi 'com.github.markzhai:blockcanary-no-op:1.5.0'
复制代码
其次,在Application的onCreate方法中开启卡顿监控:
// 注意在主进程初始化调用
BlockCanary.install(this, new AppBlockCanaryContext()).start();
复制代码
最后,继承BlockCanaryContext类去实现本身的监控配置上下文类:
public class AppBlockCanaryContext extends BlockCanaryContext {
// 实现各类上下文,包括应用标识符,用户uid,网络类型,卡顿判断阙值,Log保存位置等等
/**
* 提供应用的标识符
*
* @return 标识符可以在安装的时候被指定,建议为 version + flavor.
*/
public String provideQualifier() {
return "unknown";
}
/**
* 提供用户uid,以便在上报时可以将对应的
* 用户信息上报至服务器
*
* @return user id
*/
public String provideUid() {
return "uid";
}
/**
* 提供当前的网络类型
*
* @return {@link String} like 2G, 3G, 4G, wifi, etc.
*/
public String provideNetworkType() {
return "unknown";
}
/**
* 配置监控的时间区间,超过这个时间区间 ,BlockCanary将会中止, use
* with {@code BlockCanary}'s isMonitorDurationEnd
*
* @return monitor last duration (in hour)
*/
public int provideMonitorDuration() {
return -1;
}
/**
* 指定断定为卡顿的阈值threshold (in millis),
* 你能够根据不一样设备的性能去指定不一样的阈值
*
* @return threshold in mills
*/
public int provideBlockThreshold() {
return 1000;
}
/**
* 设置线程堆栈dump的间隔, 当阻塞发生的时候使用, BlockCanary 将会根据
* 当前的循环周期在主线程去dump堆栈信息
* <p>
* 因为依赖于Looper的实现机制, 真实的dump周期
* 将会比设定的dump间隔要长(尤为是当CPU很繁忙的时候).
* </p>
*
* @return dump interval (in millis)
*/
public int provideDumpInterval() {
return provideBlockThreshold();
}
/**
* 保存log的路径, 好比 "/blockcanary/", 若是权限容许的话,
* 会保存在本地sd卡中
*
* @return path of log files
*/
public String providePath() {
return "/blockcanary/";
}
/**
* 是否须要通知去通知用户发生阻塞
*
* @return true if need, else if not need.
*/
public boolean displayNotification() {
return true;
}
/**
* 用于将多个文件压缩为一个.zip文件
*
* @param src files before compress
* @param dest files compressed
* @return true if compression is successful
*/
public boolean zip(File[] src, File dest) {
return false;
}
/**
* 用于将已经被压缩好的.zip log文件上传至
* APM后台
*
* @param zippedFile zipped file
*/
public void upload(File zippedFile) {
throw new UnsupportedOperationException();
}
/**
* 用于设定包名, 默认使用进程名,
*
* @return null if simply concern only package with process name.
*/
public List<String> concernPackages() {
return null;
}
/**
* 使用 @{code concernPackages}方法指定过滤的堆栈信息
*
* @return true if filter, false it not.
*/
public boolean filterNonConcernStack() {
return false;
}
/**
* 指定一个白名单, 在白名单的条目将不会出如今展现阻塞信息的UI中
*
* @return return null if you don't need white-list filter.
*/
public List<String> provideWhiteList() {
LinkedList<String> whiteList = new LinkedList<>();
whiteList.add("org.chromium");
return whiteList;
}
/**
* 使用白名单的时候,是否去删除堆栈在白名单中的文件
*
* @return true if delete, false it not.
*/
public boolean deleteFilesInWhiteList() {
return true;
}
/**
* 阻塞拦截器, 咱们能够指定发生阻塞时应该作的工做
*/
public void onBlock(Context context, BlockInfo blockInfo) {
}
}
复制代码
能够看到,在上述配置中,咱们指定了卡顿的阈值为1000ms。接下来,咱们能够测试一下BlockCanary监测卡顿时的效果,这里我在Activity的onCreate方法中添加以下代码使线程休眠3s:
try {
Thread.sleep(3000);
} catch (InterruptedException e) {
e.printStackTrace();
}
复制代码
而后,咱们运行项目,打开App,便可看到相似LeakCanary界面那样的卡顿信息堆栈。
除了发生卡顿时BlockCanary提供的图形界面可供开发和测试人员直接查看卡顿缘由以外。其最大的做用仍是在线上环境或者自动化monkey测试的环节进行大范围的log采集与分析,对于分析的纬度,能够从如下两个纬度来进行:
在卡顿的周期以内,应用确实发生了卡顿,可是获取到的卡顿信息可能会不许确,和咱们的OOM同样,也就是最后的堆栈信息仅仅只是一个表象,并非真正发生问题时的一个堆栈。下面,咱们先看下以下的一个示意图:
假设主线程在T1到T2的时间段内发生了卡顿,卡顿检测方案获取卡顿时的堆栈信息是T2时刻,可是实际上发生卡顿的时刻多是在这段时间区域内另外一个耗时过长的函数,那么可能在咱们捕获卡顿的时刻时,真正的卡顿时机已经执行完成了,因此在T2时刻捕获到的一个卡顿信息并不可以反映卡顿的现场,也就是最后呈现出来的堆栈信息仅仅只是一个表象,并非真正问题的藏身之处。
咱们能够获取卡顿周期内的多个堆栈,而不只仅是最后一个,这样的话,若是发生了卡顿,咱们就能够根据这些堆栈信息来清晰地还原整个卡顿现场。由于咱们有卡顿现场的多个堆栈信息,咱们彻底知道卡顿时究竟发生了什么,到底哪些函数它的调用时间比较长。接下来,咱们看看下面的卡顿检测优化流程图:
根据图中,能够梳理出优化后的具体实现步骤为:
经过上述的优化,咱们就能够知道在整个卡顿周期以内,到底是哪些方法在执行,哪些方法比较耗时。
可是这种海量卡顿堆栈的处理又存在着另外一个问题,那就是高频卡顿上报量太大,服务器压力较大,这里咱们来分析下如何减小服务端对堆栈信息的处理量。
在出现卡顿的状况下,咱们采集到了多个堆栈,大几率的状况下,可能会存在多个重复的堆栈,而这个重复的堆栈信息才是咱们应该关注的地方。咱们能够对一个卡顿下的堆栈进行能hash排重,找出重复的堆栈。这样,服务器须要处理的数据量就会大大减小,同时也过滤出了咱们须要重点关注的对象。对于开发人员来讲,就能更快地找到卡顿的缘由。
在本节中,咱们学习了自动化卡顿检测的原理,而后,咱们使用这种方案进行了实战,最后,我还介绍了这种方案的问题和它的优化思路。
在本篇文章中,咱们主要对卡顿优化分析方法与工具 、自动化卡顿检测方案及优化相关的知识进行了全面且深刻地讲解,这里再简单总结一下本篇文章涉及的两大主题:
下篇,笔者将带领你们更加深刻地去学习卡顿优化的相关知识,敬请期待~
一、国内Top团队大牛带你玩转Android性能分析与优化 第6章 卡顿优化
三、《Android移动性能实战》第四章 CPU
四、《Android移动性能实战》第七章 流畅度
五、Android dumpsys cpuinfo 信息解读
七、nanoscope-An extremely accurate Android method tracing tool
九、lancet-A lightweight and fast AOP framework for Android App and SDK developers
十、MethodTraceMan-用于快速找到高耗时方法,定位解决Android App卡顿问题
十二、使用 ftrace
1三、profilo-A library for performance traces from production
1四、ftrace 简介
1五、atrace源码
1六、AndroidAdvanceWithGeektime / Chapter06
1七、AndroidAdvanceWithGeektime / Chapter06-plus
欢迎关注个人微信:
bcce5360
因为微信人数超过200人只能邀请入群,因此,麻烦你们想进微信群的朋友们,加我微信拉你进群。
2千人QQ群,Awesome-Android学习交流群,QQ群号:959936182, 欢迎你们加入~