百度APP-Android H5首屏优化实践

时间 2020-04-07

标签百度 app android h5 优化实践栏目 Android 繁體版

原文原文链接

本文做者：yanxin1563css

本文做者：html

kanglei前端

1、背景

百度App自2016年上半年尝试Feed流业务形态，至2017年下半年，历经10个版本的迭代，基本完成了产品形态的初步探索。在整个Feed流形态的闭环中，新闻详情页（文中称为落地页）做为重要的组成部分，若是打开页面后，loading时间过长，会严重影响用户体验。所以咱们针对落地页这种H5的首屏展示速度进行了长期优化，本文会详细阐述整个优化思路和技术细节java

2、方法论

经过分析用户反馈，发现当时的落地页从点击到首屏展示平均须要3s的时间，每次用户兴致勃勃的想要浏览感兴趣的文章时，却由于过长的loading时间，而不耐烦的选择了back。为了提高用户体验，咱们进行了如下工做：react

经过用户反馈、QA测试等多种渠道，发现落地页首屏加载慢问题android
定义首屏性能指标（首屏含图，以图片加载为准；首屏无图，以文字渲染结束为准）web
NA、内核、H5三方针对本身加载H5的流程进行划分并埋点上报后端
统计侧根据三端上报的数据产出平均值、80分位值的性能报表缓存
分析性能报表，找到不合理的耗时点，并进行优化性能优化
以AB实验方式，对比优化先后的性能报表数据，产出优化效果，同时评估用户体验等相关指标
按照长期优化的方式，不断分析定位性能瓶颈点并优化，以AB实验方式评估效果，最终达到咱们的落地页秒开目标

3、Hybrid方案简述及性能瓶颈

（一）方案简述

优化以前，咱们与业内大多数的App同样，在落地页的技术选型中，为了知足跨平台和动态性的要求，采用了Hybrid这种比较成熟的方案。Hybrid，顾名思义，即混合开发，也就是半原生半Web的方式。页面中的复杂交互功能采用端能力的方式，调用原生API来实现。成本低，灵活性较好，适合偏信息展现类的H5场景

下面用一张图来表示百度App中Hybrid的实现机制和加载流程

（二）性能瓶颈

为了分析Hybrid方案首屏展示较慢的缘由，找到具体的性能瓶颈，客户端和前端分别针对各自加载过程当中的关键节点进行埋点统计，并借由性能监控平台日志进行展现，下图是截取的某一天全网用户的落地页首屏展示速度80分位数据

各阶段性能点能够按Hybrid加载流程进行划分，能够看到，从点击到首屏展示，大体须要2600ms，其中初始化NA组件须要350ms，Hybrid初始化须要170ms，前端H5执行JS获取正文并渲染须要1400ms，完成图片加载和渲染须要700ms的时间

咱们具体分析下四个阶段的性能损耗主要发生在哪些地方：
1) 初始化NA组件
从点击到落地页框架初始化完成，主要工做为初始化WebView，尤为是第一次进入（WebView首次建立耗时均值为500ms）

2) Hybrid初始化

这个阶段的工做主要包含两部分，一个是根据调起协议中传入的相关参数，校验解压下发到本地的Hybrid模板，大体须要100ms的时间；此外，WebView.loadUrl执行后，会触发对Hybrid模板头部和Body的解析

3) 正文加载&渲染

执行到这个阶段，内核已经完成了对Hybrid模板头部和body的解析，此时须要加载解析页面所需的JS文件，并经过JS调用端能力发起对正文数据的请求，客户端从Server拿到数据后，用JsCallback的方式回传给前端，前端须要对客户端传来的JSON格式的正文数据进行解析，并构造DOM结构，进而触发内核的渲染流程；此过程当中，涉及到对JS的请求，加载、解析、执行等一系列步骤，而且存在端能力调用、JSON解析、构造DOM等操做，较为耗时

4) 图片加载

第（3）步中，前端获取到的正文数据包含落地页的图片地址集，在完成正文的渲染后，须要前端再次执行图片请求的端能力，客户端这边接收到图片地址集后按顺序请求服务器，完成下载后，客户端会调用一次IO将文件写入缓存，同时将对应图片的本地地址回传给前端，最终经过内核再发起一次IO操做获取到图片数据流，进行渲染；

整体来看，图片渲染的时间依赖前端的解析效率、端能力执行效率、下载速度、IO速度等因素

经过分析，延伸出对Hybrid方案的一些思考：

渲染为何这么慢
图片请求可否提早
串行逻辑是否能够改成并行
WebView初始化时间是否还能够优化

4、百度App落地页优化方案

（一）CloudHybrid

基于以前对Hybrid性能的分析，咱们内部孵化了一个叫作CloudHybrid的项目，用来解决落地页首屏展示慢的痛点；一句话来形容CloudHybrid方案，就是采用后端直出+预取+拦截的方式，简化页面渲染流程，提早化&并行化网络请求逻辑，进而提高H5首屏速度

1.后端直出-快速渲染首屏

a. 页面静态直出

对于Hybrid方案来讲，端上预置和加载的html文件只是一个模板文件，内部包含一些简单的JS和CSS文件，端上加载HTML后，须要执行JS经过端能力从Server异步请求正文数据，获得数据后，还须要解析JSON，构造DOM，应用CSS样式等一系列耗时的步骤，最终才能由内核进行渲染上屏；为了提高首屏展现速度，能够利用后端渲染技术(smarty)对正文数据和前端代码进行整合，直出首屏内容，直出后的html文件包含首屏展示所需的内容和样式，内核能够直接渲染；首屏外的内容（包括相关推荐、广告等）能够在内核渲染完首屏后，执行JS，并利用preact进行异步渲染，百度APP直出方案：

对于客户端来讲，从CDN中拉取到的html都是已经在server渲染好首屏的，这样的内容无需二次加工，展示速度能够大大提高，仅直出一点，手百Feed落地页的首屏性能数据就从2600ms优化到2000ms之内

b. 动态信息回填

为了保证首屏渲染结果的准确性，除了在server侧对正文内容和前端代码进行整合外，还须要一些影响页面渲染的客户端状态信息，例如首图地址、字体大小、夜间模式等
这里咱们采用动态回填的方式，前端会在直出的html中定义一系列特殊字符，用来占位；客户端在loadUrl以前，会利用正则匹配的方式，查找这些占位字符，并按照协议映射成端信息；通过客户端回填处理后的html内容，已经具有了展示首屏的全部条件

c. 动画间渲染

先看下优化先后效果，第一幅是优化前，第二幅是优化后：

正常来讲，直出后的页面展示速度已经很快了；但在实际开发中，你可能会遇到即便本身的数据加载速度再快，仍然会出现Activity切换过程当中没法渲染H5页面的问题（能够经过开发者模式放慢动画时间来验证），产生视觉上的白屏现象（如上面优化前图）
咱们经过研究源码发现，系统处理view绘制的时候，有一个属性setDrawDuringWindowsAnimating，从命名能够看出来，这个属性是用来控制window作动画的过程当中是否能够正常绘制，而刚好在Android 4.2到Android N之间，系统为了组件切换的流程性考虑，该字段为false，咱们能够利用反射的方式去手动修改这个属性，改进后的效果见上面优化后图

/**
     * 让 activity transition 动画过程当中能够正常渲染页面
     */
    private void setDrawDuringWindowsAnimating(View view) {
        if (Build.VERSION.SDK_INT > Build.VERSION_CODES.M
                || Build.VERSION.SDK_INT < Build.VERSION_CODES.JELLY_BEAN_MR1) {
            // 1 android n以上  & android 4.1如下不存在此问题，无须处理
            return;
        }
        // 4.2不存在setDrawDuringWindowsAnimating，须要特殊处理
        if (Build.VERSION.SDK_INT < Build.VERSION_CODES.JELLY_BEAN_MR1) {
            handleDispatchDoneAnimating(view);
            return;
        }
        try {
            // 4.3及以上，反射setDrawDuringWindowsAnimating来实现动画过程当中渲染
            ViewParent rootParent = view.getRootView().getParent();
            Method method = rootParent.getClass()
                    .getDeclaredMethod("setDrawDuringWindowsAnimating", boolean.class);
            method.setAccessible(true);
            method.invoke(rootParent, true);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
    /**
     * android4.2能够反射handleDispatchDoneAnimating来解决
     */
    private void handleDispatchDoneAnimating(View paramView) {
        try {
            ViewParent localViewParent = paramView.getRootView().getParent();
            Class localClass = localViewParent.getClass();
            Method localMethod = localClass.getDeclaredMethod("handleDispatchDoneAnimating");
            localMethod.setAccessible(true);
            localMethod.invoke(localViewParent);
        } catch (Exception localException) {
            localException.printStackTrace();
        }
    }

2.智能预取-提早化网络请求

通过直出的改造以后，为了更快的渲染首屏，减小过程当中涉及到的网络请求耗时，咱们能够按照必定的策略和时机，提早从CDN中请求部分落地页html，缓存到本地，这样当用户点击查看新闻时，只需从缓存中加载便可。手百预取服务架构图：

目前手百预取服务支撑着图文、图集、视频、广告等多个业务方，根据业务场景的不一样，触发时机能够自定义，也能够遵循咱们默认的刷新、滑停、点击等时机，此外，咱们会对预取内容进行优先级排序（根据资源类型、触发时机），会动态的根据当前手机状态信息进行并发控制和流量控制，在一些降级场景中，server还能够经过云控的方式来控制是否预取以及预取的数量

3.通用拦截-缓存共享、请求并行

在落地页中，除了文本外，图片也是重要的组成部分。直出解决了文字展示的速度问题，但图片的加载渲染速度仍不理想，尤为是首屏中带有图片的文章，其首图的渲染速度才是真正的首屏时间点
传统Hybrid方案，前端页面经过端能力调用NA图片下载能力来缓存和渲染图片，虽然实现了客户端和前端图片缓存的共享，但因为JS执行时机较晚，且屡次端能力调用存在效率问题，致使图片渲染延后

初步改进方案：为了提高图片加载速度，减小JS调用耗时，改成纯H5请求图片，速度虽然有所提高，可是客户端和前端缓存没法共享，当点击图片调起NA图片查看器时，没法作到沉浸式效果，且仍需重复下载一次图片，形成流量浪费
终极方案：借由内核的shouldInterceptRequest回调，拦截落地页图片请求，由客户端调用NA图片下载框架进行下载，并以管道方式填充到内核的WebResourceResponse中

此方案在知足图片渲染速度的同时，解耦了客户端和前端代码，客户端充当server角色，对图片进行请求和缓存控制，保证前端和客户端能够共用图片缓存，改造后的方案，非首图展示流程，页面不卡顿，首屏80分位值缩短80ms~150ms

效果以下，第一幅图为优化前，第二幅为优化后：

4.总体方案流程

（二）新的优化尝试

1.WebView预建立

为了减小WebView的性能损耗，咱们能够在合适时机提早建立好WebView，并存入缓存池，当页面须要显示内容时，直接从缓存池获取建立好的WebView，根据性能数据显示，WebView预建立能够减小首屏渲染时间200ms+

具体以Feed落地页为例，当用户进入手百并触发Feed吸顶操做后，咱们会建立第一个WebView，当用户进入落地页后，会从缓存池中取出来渲染H5页面，为了避免影响页面的加载速度，同时保证下次进入落地页缓存池中仍然有可用的WebView组件，咱们会在每次页面加载完成（pageFinish）或者back退出落地页的时机，去触发预建立WebView的逻辑

因为WebView的初始化须要和context进行绑定，若想实现预建立的逻辑，须要保证context的一致性，常规作法咱们考虑能够用fragment来实现承载H5页面的容器，这样context能够用外层的activity实例，但Fragment自己的切换流畅度存在必定问题，而且这样作限定了WebView预建立适用的场景。为此，咱们找到了一种更加完美的替代方案，即MutableContextWrapper

Special version of ContextWrapper that allows the base context to be modified after it is initially set. Change the base context for this ContextWrapper. All calls will then be delegated to the base context. Unlike ContextWrapper, the base context can be changed even after one is already set.
简单来讲，就是一种新的context包装类，容许外部修改它的baseContext，而且全部ContextWrapper调用的方法都会代理到baseContext来执行

下面是截取的一段预建立WebView的代码：

/**
     * 建立WebView实例
     * 用了applicationContext
     */
    @DebugTrace
    public void prepareNewWebView() {
        if (mCachedWebViewStack.size() < CACHED_WEBVIEW_MAX_NUM) {
            mCachedWebViewStack.push(new WebView(new MutableContextWrapper(getAppContext())));
        }
    }
    /**
     * 从缓存池中获取合适的WebView
     * 
     * @param context activity context
     * @return WebView
     */
    private WebView acquireWebViewInternal(Context context) {
        // 为空，直接返回新实例
        if (mCachedWebViewStack == null || mCachedWebViewStack.isEmpty()) {
            return new WebView(context);
        }
        WebView webView = mCachedWebViewStack.pop();
        // webView不为空，则开始使用预建立的WebView,而且替换Context
        MutableContextWrapper contextWrapper = (MutableContextWrapper) webView.getContext();
        contextWrapper.setBaseContext(context);
        return webView;
    }

2.NA组件懒加载

a. WebView初始化完成，马上loadUrl，无需等待框架onCreate或者OnResume结束
b. WebView初始完成后到页面首屏绘制完成之间，尽可能减小UI线程的其余操做，繁忙的UI线程会拖慢WebView.loadUrl的速度

具体到Feed落地页场景，因为咱们的落地页包含两部分，WebView+NA评论组件，正常流程会在WebView初始化结束后，开始评论组件的初始化及评论数据的获取。因为此时评论的初始化仍处在onCreate的UI消息处理中，会严重延迟内核加载主文档的逻辑。考虑到用户进入落地页的时候，评论组件对用户来讲并不可见，因此将评论组件的初始化延迟到页面的pageFinish时机或者firstScreenPaintFinished；80分位性能提高60ms~100ms

3.内核优化

a. 内核渲染优化：
内核中主要分为三个线程（IOThread、MainThread、ParserThread），首先IOThread会从网络端或者本地获取html数据，并把数据交给MainThread（渲染线程，十分繁忙，用于JS执行，页面布局等），为了保证MainThread不被阻塞，须要额外起一个后台线程（ParserThread）用来作html的解析工做。ParserThread每解析到落地页html中带有特殊class标记的一个div标签或者P标签（图中的first、second）时，就会触发一次MainThread的layout工做，并把layout后获得的高度与屏幕高度进行对比，若是当前layout高度已经大于屏幕高度，咱们认为首屏内容已经完成布局，能够触发渲染上屏逻辑，没必要等到整篇html所有解析完成再上屏，提早了首屏的渲染时间；80分位下，内核的渲染优化能够提高首屏速度100ms~200ms

b. 预加载JS：
预建立好WebView后，经过预加载JS（与内核约定好的JS内容，内核侧执行该JS时，只作初始化操做），触发WebView初始化逻辑，缩短后续加载url耗时；80分位性能提高80ms左右

5、新的问题-流量和速度的平衡

频繁预取会带来流量的浪费：预取的命中率虽然达到了90%以上，但有效率仅有15%

解决思路：

压缩预取的包大小，减小下行流量
少预取或者不预取

（一）精简预取数据：

图文：优化直出html中内联的css、icon等数据，数据大小减小约40%

（二）后端智能预取：

1) 图文：经过对图文资源进行评分，来决定4G是否须要预取，多组AB试验最优效果劣化9.5ms
2)视频：为了平衡性能和流量，在性能劣化可接受的范围内（视频起播时间劣化100ms），针对视频部分采用流量高峰期不预取的策略，减小视频总流量约7%，总体带宽峰值降低3%

（三）AI智能预取

通用用户操做行为，对Feed预取进行AI预测，减小无效预取的数量。

6、总结&展望

（一）优化总结

在总结以前，先来看下总体优化的先后效果对比，第一幅为优化前，第二幅为优化后：

能够看到，通过一系列的优化手段，落地页已经实现了秒开效果。回顾所作的事情，从分析用户反馈到定位性能瓶颈，再到各类优化尝试，发现全部相似的性能优化手段均可以从如下几点入手：

提早作：包括预建立WebView和预取数据
并行作：包括图片直出&拦截加载，框架初始化阶段开启异步线程准备数据等
轻量化：对于前端来讲，要尽可能减小页面大小，删减没必要要的JS和CSS，不只能够缩短网络请求时间，还能提高内核解析时间
简单化：对于简单的信息展现页面，对内容动态性要求不高的场景，能够考虑使用直出替代hybrid，展现内容直接可渲染，无需JS异步加载

（二）TODO

页面的更新机制，目前方案仅适用于偏静态页面，对于动态性要求较高的业务，须要提供页面更新机制，保证每次显示的正确性
开源之路：后续计划将咱们总结下来的这套方案打包开源，前行之路一定坎坷，但愿你们多多支持

---------------------------------

在微信-搜索页面中输入“百度App技术”，便可关注微信官方帐号。

原文连接地址：https://developer.baidu.com/topic/show/290272