高效计算——RenderScriptjava
RenderScript是安卓平台上很受谷歌推荐的一个高效计算平台,它可以自动把计算任务分配到各个可用的计算核心上,包括CPU,GPU以及DSP等,提供十分高效的并行计算能力。多是因为应用开发时的需求不够,关于RenderScript的相关文章不多,恰好我在工做中应用到此平台,作了一些笔记,所以决定整理成博文分享给你们。内容主要来源于官方文档、StackOverflow以及本身的理解,若有错误,请你们指正。本篇主要介绍RenderScript的基本概念。android
1 RenderScript简介api
RenderScript是安卓提供的一个高效计算平台。它显著的特色在于:架构
使用了RenderScript的应用与通常的安卓应用在代码编写上与并无太大区别。使用了RenderScript的应用依然像传统应用同样运行在VM中,可是你须要给你的应用编写你所须要的RenderScript代码,且这部分代码运行在native层。框架
RenderScript采用从属控制架构:底层RenderScript被运行在虚拟机中的上层安卓系统所控制。安卓VM负责全部内存管理并把它分配给RenderScript的内存绑定到RenderScript运行时,因此RenderScript代码可以访问这些内存。安卓框架对RenderScript进行异步调用,每一个调用都放在消息队列中,而且会被尽快处理。异步
RenderScript工做流程须要经历三层:ide
RenderScript的主要优势:函数
缺点:工具
2 使用RenderScript性能
使用RenderScript须要对编译或者开发环境进行必定的配置。
使用RenderScript主要分为两个步骤:编写.rs文件以及在Android framework中使用RenderScript,下面分别介绍。
2.1 环境配置
对于Android 3.0 (API level 11)及以上的能够在android.renderscript包中获取
经过android.support.v8.renderscript包获取,能够支持API level 8及以上的平台,官方强烈建议使用此支持包的方式来获取API
Android SDK Tools revision 须要22.2及以上
Android SDK Build-tools revision 须要18.1.0及以上
renderscript.target=18 renderscript.support.mode=true
或者在AS中的build.gradle的defaultConfig中添加
renderscriptTargetApi 18 renderscriptSupportModeEnabled true
注意:target的值应该为11及以上,但推荐使用18.若是在Manifest中配置的minSDK的值与target的值不相同,那么在编译的时候,将使用target的值替代Mainfest中的minSDK值。
2.2 编写RenderScript文件
RenderScript代码放在.rs或者.rsh文件中,在RenderScript代码中包含计算逻辑以及声明全部必须的变量和指针,一般一个.rs文件包含以下几个部分:
1.分配给RenderScript的输入输出地址的指针。在Android3.2以及更低版本中,输入输出的指针都须要,在Android4.0及之后的版本中,给出其中一个或者两个均可以
a) 指向用户数据的指针。该数据会在RenderScript的计算中用到。该数据能够指向原始类型或者复杂结构类型
b) 用户数据的大小
从官方文档来看,老版本的文档中有介绍root,而新版本的则用kernel替代。官方在弱化root函数的概念,而是推荐使用kernel概念。本质上来讲,root仅仅是一个写法形式上特殊的kernel而已。
uchar4 __attribute__((kernel)) invert(uchar4 in, uint32_t x, uint32_t y) { uchar4 out = in; out.r = 255 - in.r; out.g = 255 - in.g; out.b = 255 - in.b; return out; }
compute kernel基本与一个C函数同样,可是有以下特征:
a) __attribute__((kernel))标志。该标志表示该函数是一个RenderScript kernel函数,而不是一个invokable函数
b) in参数及其类型。在RenderScript kernel中,这个参数将会基于传给kernel的输入Allocation而自动赋值,且默认状况下,对于Allocation中每个Element都将会执行一遍kernel函数
c) 返回值及其类型。每次kernel函数执行的返回值将会自动写入到输出Allocation的正确位置。RenderScript将会对输入输出Allocation进行检查,若是他们与kernel函数声明不匹配则将抛出异常。
每一个kernel都应该有一个输入Allocation或者一个输出Allocation或者两者都有,但不能有两个及以上的输入或者输出Allocation。若是须要在kernel中访问多个输入或者输出,则须要声明rs_allocation全局变量来担任多余一个的输入或者输出角色,而后再kernel函数或者invokable函数中经过rsGetElementAt_type()或者rsSetElementAt_type()来访问或者设置相应的Allocation,其中type为对应Allocation的Element类型对应的数据类型,好比uchar4。
在kernel中,能够经过可选的xyz参数来获取当前Element在整个Allocation中的坐标值,好比上面的invert中就经过xy来获取了xy坐标值。注意xyz的参数名不能设置为其余名称,且类型必须为uint32_t。
a) #pragma rs_fp_full:默认的等级。表示的彻底遵照IEEE 754-2008 standard的精度要求
b) #pragma rs_fp_relaxed:不严格的IEEE 754-2008 standard的精度要求
c) #pragma rs_fp_imprecise:比relaxed更低的精度要求
对于大部分应用来讲,使用relaxed精度要求均可以知足要求而无任何反作用
example.rs :
#pragma version(1) #pragma rs java_package_name(com.willhua.rgbtoyuv) #pragma rs_fp_relaxed typedef struct Point_T{ int x; int y; }Point; //script variable uint32_t inW; uint32_t inH; uint32_t inCount; rs_allocation outYUV; struct Point point; //root void root(const uchar4 *in, uint32_t x, uint32_t y){ struct myStruct my; my.x = 0; struct myStruct my2 = my; int u = my.x; uchar R,G,B; int Y,U,V; R = (*in).r; G = (*in).g; B = (*in).b; Y = ( ( 66 * R + 129 * G + 25 * B + 128) >> 8) + 16; uint32_t yIndex = y * inW + x; Y = ((Y < 0) ? 0 : ((Y > 255) ? 255 : Y)); rsSetElementAt_uchar(outYUV, ((uchar)Y), yIndex); if((x & 1) == 0 && (y & 1) == 0) { U = ( ( -38 * R - 74 * G + 112 * B + 128) >> 8) + 128; V = ( ( 112 * R - 94 * G - 18 * B + 128) >> 8) + 128; uint32_t index = (y >> 1) * inW + x + inCount; U = ((U < 0) ? 0 : ((U > 255) ? 255 : U)); V = ((V < 0) ? 0 : ((V > 255) ? 255 : V)); rsSetElementAt_uchar(outYUV, ((uchar)U), index + 1); rsSetElementAt_uchar(outYUV, ((uchar)V), index ); } } //compute kernel __attribute__((kernel)) invert(uchar4 in, uint32_t x, uint32_t y) { uchar4 out = in; out.r = 255 - in.r; out.g = 255 - in.g; out.b = 255 - in.b; return out; } //invokable function void setInPara(uint32_t w, uint32_t h){ inW = w; inH = h; inCount = w * h; } //init void init(){ }
2.3 在Android framework层调用RenderScript
虽然各个应用使用RenderScript细节各不相同,但大致有着这样的模式:
2.4 RenderScript工做流程
最开始就提到,RenderScript是一个主从架构,底层的RenderScript被上层的Android framework所控制。其工做流程也正是如此。从在Android framework建立RenderScript的context开始,而后给RenderScript层分配、绑定相关内存,对script变量进行初始化,而后调用forEach函数通知启动RenderScript计算。RenderScript将会自动把它的计算任务分配到各个可用的核心上来完成计算任务(如今还只能支持CPU,之后将会支持到GPU以及DSP,且代码不须要变更)。RenderScript计算完成之后将会自动把计算结果放到相应的Allocation内存,而后在Android framework层再从Allocation中copy出数据,最后Android framework层命令RenderScript释放资源,流程介绍。下图展现了RenderScript的工做流程: