原文连接 : Speed up your app
原文做者 : UDI COHEN
译文出自 : 开发技术前线 www.devtf.cn。未经容许,不得转载!
译者 : zijianwang90
校对者:
状态 : 完成html
几周以前,我在Droidcon NYC上有过一次关于Android性能优化的演讲。java
我在这个演讲中花费了大量的时间,由于我想经过真实的例子展示性能问题,以及我是经过什么样的工具去发掘这些问题的。由于时间缘由,在演讲中我不得不舍弃一半的内容。在这篇文章中,我会总结在演讲中我所讨论的全部内容,而且给出实例android
点此连接进入演讲视频git
如今,咱们来逐一讨论我在演讲中说起的一些重点内容,但愿个人阐述足够的清晰。首先,在我进行性能优化的时候我遵循以下原则:github
每当我遇到性能问题,或者尝试发现性能问题的时候,我会遵循以下原则:web
Systrace是一个很是好但却有可能被你忽视的工具,这是由于开发者们每每不肯定Systrace可以为他们提供什么样的信息。shell
Systrace会展现一个运行在手机上程序情况的概览。这个工具提醒了咱们手机实际上是一个能够在同一时间完成不少工做的电脑。在最近的一次SDK更新中,这个工具在数据分析能力上获得了提高,用以帮助咱们寻找性能问题之所在。缓存
下面让咱们来看看Systrace长什么样子:安全
你能够经过Android Device Monitor Tool或者是命令行来生成Systrace文件,想了解更多猛戳此处。性能优化
在视频中,我向你们介绍了Systrace中不一样区域的功能。固然最有趣的仍是Alerts和Frames两栏,它们展现了经过手机来的数据而生成出来的可视化分析结果。让咱们来选择最上方的alerts瞧瞧:
这个警告指出了,有一个View#draw()方法执行了比较长的时间。咱们能够在下面看到问题的描述,连接,甚至是相关的视频。下面咱们看 Frames这一行,能够看到这里展现了被绘制出来的每一帧,而且用绿、黄、红三颜色来区分它们在绘制时的性能。咱们选一个红色帧来瞅瞅:
在最下方,咱们看到了与这一帧所相关的一些警告。在这三个警告中,有一个是咱们上面所提到的(View#draw())。接下来咱们在这一帧处放大并在下方展开“Inflation during ListView recycling”这条警告:
咱们能够看到警告部分的总耗时,32毫秒,远高于了咱们对保障60fps所需的16毫秒绘制时间。同时还有更多的ListView每一个条目的绘制时 间,大约是6毫秒每一个条目,总共五个。而Description描述项中的内容会帮助咱们理解问题,甚至提供问题的解决方案。回到咱们上一张图片,咱们可 以在“inflate”这一个块区处放大,而且观察究竟是哪些View在被填充过程当中耗时比较严重。
下面是另一个渲染过慢的实例:
在选择了某一帧以后,咱们能够按“m”键来高亮这一帧,而且在上方看到了这一部分的耗时,如图,咱们看到了这一阵的绘制总共耗时超过19毫秒。而当咱们展开这一帧惟一的一个警告时,咱们发现了“Scheduling delay”这条错误。
Scheduling delay(调度延迟)的意思就是一个线程在处理一块运算的时候,在很长一段时间都没有被分配到CPU上面作运算,从而致使这个线程在很长一段时间都没有完成工做。咱们选择这一帧中最长的一块,从而获得更加详细的信息:
在红框区域内,咱们看到了“Wall duration”,他表明着这一区块的开始到结束的耗时。之因此叫做“Wall duration”,是由于他就像是墙上的一个时钟,从线程的一开始就为你计时。
可是,CPU Duration一项中显示了实际CPU在处理这一区块所消耗的时间。
很显然,两个时间的差距仍是很是大的。整个区块耗时18毫秒,而在这之中CPU只消耗了4毫秒的时间去运算。这就有点奇怪了,因此咱们应该看一下在这整个过程之中,CPU去干嘛了。
能够看到,全部四个线程都很是的繁忙。
选择其中的一个线程会告诉咱们是哪一个程序在占用他,在这里是一个包名为com.udinic.keepbusyapp的程序。在这里,因为另一个程序占用CPU,致使了咱们的程序未能得到足够的CPU资源。
可是这种状况实际上是暂时的,由于被其余后台应用占用CPU的状况并很少见(- -),但仍有其余应用的线程或是主线程占用CPU。而Traceview也只能为咱们提供一个概览,他的深度是有限的。因此要找到咱们app中究竟是什么 让咱们的CPU繁忙,咱们还要借助另外一个工具——Traceview。
Traceview是一个性能测试工具,展现了全部方法的的运行时间。下面让咱们来瞅瞅他是啥样的:
这个工具能够从Android Device Monitor中打开也能够经过代码打开。更多的消息信息清看这里。
下面让咱们来看看每一列的含义:
我打开一个滑动不太顺滑的应用。开启记录,滑动一点后中止记录。展开getView()方法,以下图:
这个方法被调用了12次,每次CPU会消耗3毫秒左右,可是每次调用的总耗时却高达162毫秒!绝对有问题啊!
而看看这个方法的children,咱们能够看到这其中的每一个方法在耗时方面是如何分布的。Thread.join()方法战局了98%的 inclusive real time。这个方法在等待另外一个线程结束的时候被调用。在Children中另一个方法就是Tread.start()方法,而之因此整个方法耗时很 长,我猜想是由于在getView()方法中启动了线程而且在等待它的结束。
可是这个线程在哪儿?
咱们在getView()方法中并不能看到这个线程作了什么,由于这段逻辑不在getView()方法之中。因而我找到了Thread.run()方法,就是在线程被建立出来时候所运行的方法。而跟随这个方法一路向下,我找到了问题的元凶。
我发现了BgService.doWork()方法的每次调用花费了将近14毫秒,而且有四十个这东西!并且getView()中还有可能调用屡次 这个方法,这就解释了为何getView()方法执行时间如此之长。这个方法让CPU长时间的保持在了繁忙状态。而看看Exclusive CPU time,咱们能够看到他占据了80%的CPU时间!此外,根据Exclusive CPU time排序,能够帮咱们更好的定位那些耗时很长的方法,而他们颇有可能就是形成性能问题的罪魁祸首。
关注这些耗时方法,例如getView(),View#onDraw()等方法,能够很好的帮助咱们寻找为何应用运行缓慢的缘由。但有些时候,还 会有一些其余的东西来占用宝贵的CPU资源,而这些资源若是被运用在UI的绘制上,也许咱们的应用会更加流畅。Garbage Collector垃圾回收机制会不时的运行,回收那些没用的对象,一般来说这不会影响咱们在前台运行的程序。但若是GC被运行的过于频繁,他一样能够影 响咱们应用的执行效率。而咱们该如何知道回收的是否过于频繁了呢…
Android Studio在最近的更新中给予了咱们更增强大的工具去分析性能问题。在底部Android选项中的Memory选项卡,会显示有多大的数据在何时被分配到了堆内存之中,他是长成这个样子的:
而当图表中出现一个小的下滑的时候,说明GC回收发生了,他清除了没必要要的对象而且腾出了必定的堆空间。而在这张图表的左侧有两个工具供咱们使用,Head dump和Allocation Tracker。
为了找出究竟是什么正在占用咱们的堆内存,咱们可使用左边的heap dump按钮。他会提供一个堆内存占用状况的快照,而且会在Android Studio中打开一个单独的报告界面。
在左侧,咱们看到一个图标展现了堆中全部的实例,按照类进行分组。而对于每个实例,会展现有多少个实例的对象被分配到堆中,以及他们的所占用的空 间(Shallow size浅尺寸),以及这些对象在内存中仍然占用的空间,后者告诉了咱们多少的内存空间将会被释放若是这些实例被释放。这个工具可让咱们直观的观察处内 存是被如何占用的,帮助咱们分析咱们使用的数据结构和对象之间的关系,以便发现问题并使用更加高效的数据结构,解开和对象之间的关联,而且下降 Ratained Memory的占用。而最终目的,就是尽量的下降咱们的内存占用。
回过头来看图表,咱们发现MemoryActivity存在39个实例,这对于一个Activity来讲有点奇怪。在右边选择其中的一个实例,会在下方看到全部的对这个实例的引用树状列表。
其中一个是ListenersManager对象中的一个集合。而观察这个activity的其余实例,就会他们都由于这个对象而被保留在了内存之中。这也解释了为何这些对象占用了如此多的内存:
这个现象就叫作“内存泄露”,咱们的activity已经被销毁,可是他们的对象却由于始终被引用着而没法被垃圾回收。咱们能够避免这种状况,例如 确保这些对象再被销毁后不会被其余对象一直引用着。在咱们这个例子中,在Activity被销毁后,ListernesManager并不须要保持着对这 些对象的引用。因此解决办法就是在onDestroy()回调方法中移除这些引用。
内存泄露以及其余较大的对象会在堆中占据不少的控件,它们减小着可用内存的同时也频繁的形成垃圾回收。而垃圾回收又回形成CPU的繁忙,而堆内存并不会变得更大,最终就会致使更悲剧的结果发生:OutOfMemoryException内存溢出,并致使程序崩溃。
另一个更先进的工具就是Eclipse Memory Analyzer Tool (Eclipse MAT):
这个工具能够作全部Android Studio能够作的,而且辨别可能出现的内存泄露,以及提供更加高级的搜索功能,例如搜索全部大于2MB的Bitmap实例,或是搜索全部空的Rect对象。
另一个很好的工具是LeakCanary,是一个第三方库,能够观察应用中的对象而且确保它们没有形成泄漏。而若是形成泄漏了,会有一个推送来提醒你在哪里发生了什么。
咱们能够在内存图表的左侧找到Allocation Tracker的启动和中止按钮。他会生成一个在必定时间内被生成的全部实例的报告,而且按照类分型分组:
或者按照方法分组:
同时它还能经过美观的可视化界面,告诉咱们哪些方法或类拥有最多的实例。
利用这些信息,咱们能够找到哪些占用过多内存,引起过屡次垃圾回收且又对耗时很是敏感的方法。咱们也能够利用这个工具找到不少短命的相同类的实例,从而能够考虑使用对象池的思想去尽可能的减小过多的实例被建立。
如下是一些我写代码时候遵循的规律或是技巧:
在Android 1.4中的一个全新工具,就是能够查看GPU绘制。
每一条线意味着一帧被绘制出来,而每条线中的不一样颜色又表明着在绘制过程当中的不一样阶段:
在Marshmallow版本中,有更多的颜色被加了进来,例如Measure/Layout阶段,input handling输入处理,以及一些其余的:
在使用这些功能以前,你须要在开发者选项中开启GPU rendering(GPU呈现模式分析):
接下来咱们就能够经过如下这条adb命令获得咱们想要获得的全部信息:
咱们能够本身收集这些信息并建立图表。这个命令也会打印出一些其余有用的信息,例如view层级中的层数,display lists的大小等等。在Marshmallow中,咱们也会获得更多的信息:
若是咱们须要自动化测试咱们的app,那么咱们能够本身建立服务器去运行在特定节点执行这些命令(如列表滚动,重度动画等),并观察这些数值的变 动。这能够帮助咱们找出在哪里出现了性能的降低,而且产品上线以前找到问题的所在。咱们也可以经过”framestats”关键字来找到更多更加精确的数 据,这里有更详尽的解释。
但这可不是获取GPU Rendering数据的惟一方式!
咱们在开发者选项中看过了GPU呈现模式分析内的Profile GPU Rendering”选项后,还有另一个选项就是”On screen as bars”(在屏幕上显示为条形图)。打开这个后,咱们就能够直观的看到每一帧在绘制过程当中所消耗的时间,绿色的横线则表明16ms的60fps零界值。
在右边的例子中,咱们能够看到不少帧都超出了绿线,这也意味着它花了多余16毫秒的时间去绘制。而蓝色占据了这些线条的主体,咱们知道这多是由于 过多或是过于复杂的view在被绘制。在这种状况下,当我滑动列表,由于列表中view的结构比较复杂,有一些view已经被绘制完成而一些由于过于复杂 还处于绘制阶段,而这可能就是形成这些帧超过绿线的缘由——绘制起来实在太复杂了。
我很是喜欢这个工具,同时也由于那么多人彻底不用而感到一丝的悲凉。
使用Hierarchy Viewer,咱们能够得到性能数据,观察View层级中的每个View,而且能够看到全部View的属性。咱们一样能够导出theme数据,这样能够 看到每个style中的属性值,可是咱们只能在单独运行Hierarchy Viewer的时候才能这么干,而非经过Android Monitor。一般在我进行布局设计以及布局优化的时候,我会使用到这个工具。
在正中间咱们看到的树状结构就表明了View的层级。View的层级能够很宽,但若是太宽的话(10层左右),也许会在布局和测量阶段消耗大量的性 能。在每一次View经过View#onMeasure()方法测量的时候,或是经过View#onLayout()方法布局他的全部子view的时候, 这些方法又回传递到它全部的子view上面而且重头来过。有的布局会将上述步骤作两次,例如RelativeLayout以及某些经过配置的 LinearLayout,而若是它们又层层嵌套,那么这些方法的传递会大量的增长。
在右下方,咱们看到了一个咱们布局的“蓝图”,标注了每个view的位置。当咱们点击这里(或者从树状结构中),咱们会在左侧看到他全部的属性。 在设计布局时候,有时候我不肯定为何一个view被摆在那里,而使用这个工具,我能够在树状图中找到这个view,选择,并观察他在预览窗口中的位置。 我还经过view在屏幕上最终的绘制尺寸,来设计有趣的动画,而且使用这些信息让动画或者View的位置更加的精准。我也能够经过这个工具来寻找被其余 View不当心盖住从而找不到的View,等等等等。
对于每个view咱们能够得到他测量、布局以及绘制的用是和它所包含的全部子view。在这里颜色表明了这个view在绘制过程当中,相比树中其余 view的性能表现,这是咱们找到这些性能不足view的最佳途径。鉴于咱们可以看到全部view的预览,咱们能够沿着树状图,跟随view被建立的顺 序,找寻那些能够被舍弃的多余步骤。而其中之一,也是对性能影响很是大的,就是过分绘制。
正如咱们在GPU Profiling部分看到的,在Execute黄色阶段,若是GPU有过多的东西要在屏幕上绘制,整个阶段会消耗更多的时间,同事也增长了每一帧所消耗 的时间。过分绘制每每发生在咱们须要在一个东西上面绘制另一个东西,例如在一个红色的背景上画一个黄色的按钮。那么GPU就须要先画出红色背景,再在他 上面绘制黄色按钮,此时过分绘制就是不可避免的了。若是咱们有太多层须要绘制,那么则会过分的占用GPU致使咱们每帧消耗的时间超过16毫秒。
使用“Debug GPU Overdraw”(调试过分绘制)功能,全部的过分绘制会以不一样颜色的形式展现在屏幕上。1x或是2x的过分绘制没啥问题,即使是一小块浅红色区域也不算太坏,但若是咱们看到太多的红色区域在屏幕上,那可能就有问题了,让咱们来看几个例子:
在左边的例子中,咱们看到列表部分是绿色的,一般还OK,可是在上方发生覆盖的区域是一片红色,那就有问题了。在右边的例子中,整个列表都是浅红 色。在两个例子中,都各有一个不透明的列表存在2x或3x的过分绘制。这些过分绘制可能发生在咱们给Activity或Fragment设置了全屏的背 景,同时又给ListView以及ListView的条目设置了背景色。而经过只设置一次背景色便可解决这样的问题。
注意:默认的主题会为你指定一个默认的全屏背景色,若是你的activity又一个不透平的背景盖住了默认的背景色,那么你能够移除主题默认的背景 色,这样也会移除一层的过分绘制。这能够经过配置主题配置或是经过代码的方法,在onCreate()方法中调用 getWindow().setBackgroundDrawable(null)方法来实现。
而使用Hierarchy Viewer,你能够导出一个全部view层级的PSD文件,在Photoshop中打开,而且调查不一样的layout以及不一样的层级,也可以发现一些在 布局中存在的过分绘制。而使用这些信息能够移除没必要要的过分绘制。并且,不要看到绿色就知足了,冲着蓝色去!
使用透明度可能会影响性能,可是要去理解为何,让咱们瞅瞅当咱们给view设置透明度的时候到底发生了什么。咱们来看一下下面这个布局:
咱们看到这个layout中又三个ImageView而且重叠摆放。在使用最常规的设置透明度的方法setAlpha()时,方法会传递到没一个子 view上面,在这里是每个ImageView。然后,这些ImageView会携带新的透明值被绘制入帧缓冲区。而结果就是:
这并非咱们想要看到的结果。
由于每个ImageView都被赋予了一个透明值,致使了本应覆盖的部分被融合在一块儿。幸运的是,系统为咱们解决了这个问题。布局会被复制到一个非屏幕区域缓冲区中,而且以一个总体来接收透明度,其结果再被复制到帧缓冲区。结果就是:
可是,咱们是要付出性能上面的代价的。
假如在帧缓冲区内绘制以前,还要在off-screen缓冲区中绘制一遍的话,至关于增长了一层不可见的绘制层。而系统并不知道咱们是但愿这个透明 度以何种的形式去展示,因此系统一般会采用相对复杂的一种。可是也有不少设置透明度的方法可以避免在off-screen缓冲区中的复杂操做:
在Honeycomb版本中引入了硬件加速(Hardware Accleration)后,咱们的应用在绘制的时候就有了全新的绘制模型。它引入了DisplayList结构,用来记录View的绘制命令,以便更快的进行渲染。但还有一些很好的功能开发者们每每会忽略或者使用不当——View layers。
使用View layers(硬件层),咱们能够将view渲染入一个非屏幕区域缓冲区(off-screen buffer,前面透明度部分提到过),而且根据咱们的需求来操控它。这个功能主要是针对动画,由于它能让复杂的动画效果更加的流畅。而不使用硬件层的 话,View会在动画属性(例如coordinate, scale, alpha值等)改变以后进行一次刷新。而对于相对复杂的view,这一次刷新又会连带它全部的子view进行刷新,并各自从新绘制,至关的耗费性能。使 用View layers,经过调用硬件层,GPU直接为咱们的view建立一个结构,而且不会形成view的刷新。而咱们能够在避免刷新的状况下对这个结构进行进行 不少种的操做,例如x/y位置变换,旋转,透明度等等。总之,这意味着咱们能够对一个让一个复杂view执行动画的同时,又不会刷新!这会让动画看起来更 加的流畅。下面这段代码咱们该如何操做:
很简单,对吧?
是的,可是再使用硬件layers的时候仍是有几点要牢记在心:
而对于第二个问题,咱们也有一个可视化的办法来观察硬件层更新。使用开发者选项中的“Show hardware layers updates”(显示硬件层更新)
当打开该选项后,View会在硬件层刷新的时候闪烁绿色。在好久之前我有一个ViewPager在滑动的时候有点不流畅。在开发者模式启动这个选项后,我再次滑动ViewPager,发现了以下状况:
左右两页在滑动的时候彻底变成了绿色!
这意味着他们在建立的时候使用了硬件层,并且在滑动的时候也界面也进行了刷新。而当我在背景上面使用时差效果而且让条目有一个动画效果的时候,这些 处理确实会让它进行刷新,可是我并无对ViewPager启动硬件层。在阅读了ViewPager的源码后,我发现了在滑动的时候会自动为左右两页启动 一个硬件层,而且在滑动结束后移除掉。
在两页间滑动的时候建立硬件层也是能够理解的,但对我来讲小有不幸。一般来说加入硬件层是为了让ViewPager的滑动更加流畅,毕竟它们相对复杂。但这不是个人app所想要的,我不得不经过一些编码来移除硬件层。
硬件层其实并非什么酷炫的东西。重要的是咱们要理解他的原理而且合理的使用他们,要否则你确实会遇到一些麻烦。
在准备上述这一系列例子的过程当中,我进行了不少的编码去模拟这些情景。你能够在这个Github项目中找到这些代码,同时也能够在Google Play中找到。我用不一样的Activity区分了不一样的情景,而且尽可能将他们的用文档解释清楚,以便于帮助你们理解不一样的Activity中是出现哪一种问题。你们能够边阅读各个Activity的javadoc的同时,利用咱们前面讲到的工具去玩儿这个App。
随着安卓系统的不断进化,你有话你的应用的手段也在不断变多。不少全新的工具被引入到了SDK中,以及一些新的特性被加入到了系统中(比如硬件层这东西)。因此与时俱进和懂得取舍是很是重要的。
这是一个很是棒的油管播放列表,叫Android Performance Patterns,一些谷歌出品的短视频,讲解了不少与性能相关的话题。你能够找到不一样数据结构之间的对比(HashMap vs ArrayMap),Bitmap的优化,网络优化等等,吐血推荐!
加入Android Performance Patterns的G+社群,和你们一块儿讨论,分享心得,提出问题!
更多有意思的连接:
我真心但愿你经过这篇文章得到到了足够丰富的信息和信心,从今天开始优化你的应用吧!
尝试用工具去记录,并经过一些开发者选项中的选项,开搞吧。欢迎来G+上分享你在安卓性能优化上面的心得!