用过DSP的应该都知道Q格式吧;linux
Q格式是二进制的定点数格式,相对于浮点数,Q格式指定了相应的小数位数和整数位数,在没有浮点运算的平台上,能够更快地对浮点数据进行处理,以及应用在须要恒定分辨率的程序中(浮点数的精度是会变化的);须要注意的是Q格式是概念上小数定点,经过选择常规的二进制数整数位数和小数位数,从而达到所须要的数值范围和精度,这里可能有点抽象,下面继续看介绍。算法
定点数一般表示为\(Q_{m.n}\),其中m
为整数个数,n
为小数个数,其中最高位位符号位而且以二进制补码的形式存储;安全
无符号的用\(UQ_{m.n}\)表示;函数
无符号Q格式数据的推导
这里以一个16
位无符号整数为例,\(UQ_{9.7}\)所能表示的最大数据的二进制形式以下图所示;大数据
因此不难看出,\(UQ_{9.7}\)的范围大小和精度;
根据等比数列求和公式获得,整数域最大值以下:this
小数域最大值以下:spa
所以\(UQ_{9.7}\)的范围知足 \([0,2^9-2^{-7}]\);.net
有符号Q格式数据的推导
这里以一个16
位有符号整数为例,\(UQ_{9.7}\)所能表示的最大数据的二进制形式以下图所示;code
因此不难求出,\(UQ_{9.7}\)的范围大小和精度;
根据等比数列求和公式获得,整数域最大值以下:orm
小数域最大值以下:
所以\(Q_{9.7}\)最大能表示的数为: \(2^8-2^{-7}\);
\(Q_{9.7}\)所能表示的最小数据的二进制形式以下图所示;
能够从图中看到,该数表示为\(-2^8\);
补充一下:负数在计算机中是补码的形式存在的,
补码=反码+1
,符号位为1
则表示为负数;
那么-4
该如何表示呢?
以8 bit
数据为例,以下所示;
原码:0B 0000 100
反码:0B 1111 011
补码:0B 1111 100
综上,能够获得有符号\(Q_{9.7}\)的范围是:\([-2^8,2^8-2^{-7}]\)
最大数的十六进制为0x7FFF
,以下图所示;
最小数的十六进制为0X8000
,以下图所示;
上述这两种状况,下面都会用到。
加法和减法须要两个Q格式的数据定标相同,即\(Q_{m_1.n_1}\)和\(Q_{m_2.n_2}\)知足如下条件;
int16_t q_add(int16_t a, int16_t b) { return a + b; }
上面的程序其实并不安全,在通常的DSP芯片具备防止溢出的指令,可是一般须要作一下溢出检测,具体以下所示;
int16_t q_add_sat(int16_t a, int16_t b) { int16_t result; int32_t tmp; tmp = (int32_t)a + (int32_t)b; if (tmp > 0x7FFF) tmp = 0x7FFF; if (tmp < -1 * 0x8000) tmp = -1 * 0x8000; result = (int16_t)tmp; return result; }
相似于加法的操做,须要相同定标的两个Q格式数进行相减,可是不会存在溢出的状况;
//https://great.blog.csdn.net/ int16_t q_sub(int16_t a, int16_t b) { return a - b; }
乘法一样须要考虑溢出的问题,这里经过sat16
函数,对溢出作了处理;
//https://great.blog.csdn.net/ // precomputed value: #define K (1 << (Q - 1)) // saturate to range of int16_t int16_t sat16(int32_t x) { if (x > 0x7FFF) return 0x7FFF; else if (x < -0x8000) return -0x8000; else return (int16_t)x; } int16_t q_mul(int16_t a, int16_t b) { int16_t result; int32_t temp; temp = (int32_t)a * (int32_t)b; // result type is operand's type // Rounding; mid values are rounded up temp += K; // Correct by dividing by base and saturate result result = sat16(temp >> Q); return result; }
//https://great.blog.csdn.net/ int16_t q_div(int16_t a, int16_t b) { /* pre-multiply by the base (Upscale to Q16 so that the result will be in Q8 format) */ int32_t temp = (int32_t)a << Q; /* Rounding: mid values are rounded up (down for negative values). */ /* OR compare most significant bits i.e. if (((temp >> 31) & 1) == ((b >> 15) & 1)) */ if ((temp >= 0 && b >= 0) || (temp < 0 && b < 0)) { temp += b / 2; /* OR shift 1 bit i.e. temp += (b >> 1); */ } else { temp -= b / 2; /* OR shift 1 bit i.e. temp -= (b >> 1); */ } return (int16_t)(temp / b); }
定点数\(X_q\)和浮点数\(X_f\)转换的关系知足如下公式:
其中\(X_q\)为\(Q_{m.n}\),
m
表示整数位数,n
表示小数位数;
#include <stdio.h> #include <stdint.h> #include <math.h> int main() { // 0111 1111 1111 1111 int16_t q_max = 32767; // 0x7FFF // 1000 0000 0000 0000 int16_t q_min = -32768; // 0x8000 float f_max = 0; float f_min = 0; printf("\r\n"); for (int8_t i = 15; i>=0; i--) { f_max = (float)q_max / pow(2,i); f_min = (float)q_min / pow(2,i); printf("\t| Q %d | Q %d.%d| %f | %f |\r\n", i,(15-i),i,f_max,f_min); } return 0; }
运行获得结果以下所示;
Q 格式 | Qmn | Max | Min |
---|---|---|---|
Q 15 | Q 0.15 | 0.999969 | -1.000000 |
Q 14 | Q 1.14 | 1.999939 | -2.000000 |
Q 13 | Q 2.13 | 3.999878 | -4.000000 |
Q 12 | Q 3.12 | 7.999756 | -8.000000 |
Q 11 | Q 4.11 | 15.999512 | -16.000000 |
Q 10 | Q 5.10 | 31.999023 | -32.000000 |
Q 9 | Q 6.9 | 63.998047 | -64.000000 |
Q 8 | Q 7.8 | 127.996094 | -128.000000 |
Q 7 | Q 8.7 | 255.992188 | -256.000000 |
Q 6 | Q 9.6 | 511.984375 | -512.000000 |
Q 5 | Q 10.5 | 1023.968750 | -1024.000000 |
Q 4 | Q 11.4 | 2047.937500 | -2048.000000 |
Q 3 | Q 12.3 | 4095.875000 | -4096.000000 |
Q 2 | Q 13.2 | 8191.750000 | -8192.000000 |
Q 1 | Q 14.1 | 16383.500000 | -16384.000000 |
Q 0 | Q 15.0 | 32767.000000 | -32768.000000 |
Q格式虽然十分抽象,可是且看看这个数字0x5f3759df,感受和Q格式有某种联系,它是雷神之锤3中的一个算法的魔数,毕竟游戏引擎须要充分考虑到效率,具体的由来能够看一下论文《Fast Inverse Square Root》
,下面是源码中剥出来的快速平方根算法;
float Q_rsqrt( float number ) { long i; float x2, y; const float threehalfs = 1.5F; x2 = number * 0.5F; y = number; i = * ( long * ) &y; // evil floating point bit level hacking i = 0x5f3759df - ( i >> 1 ); // what the fuck? y = * ( float * ) &i; y = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration // y = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed #ifndef Q3_VM #ifdef __linux__ assert( !isnan(y) ); // bk010122 - FPE? #endif #endif return y; }
本文介绍了Q格式的表示方式以及相应的运算,另外须要注意在Q格式运算的时候,二者定标必须相同,对于数据的溢出检测也要作相应的处理。
做者能力有限,文中不免有错误和纰漏之处,请大佬们不吝赐教 创做不易,若是本文帮到了您; 请帮忙点个赞 👍👍👍; 请帮忙点个赞 👍👍👍; 请帮忙点个赞 👍👍👍;