魔性的float浮点数精度问题

从一个问题引入

若是你之前接触过C语言,那么对下面的这段代码必定很熟悉:ios

#include <stdio.h>

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        printf("f_num1 = %f\n", f_num1);
        printf("f_num2 = %f\n", f_num2);
        printf("f_num1 + f_num2 = %f\n", f_num1 + f_num2);

        return 0;
}

相信不少人不用运行,可以直接报出答案, f_num1 = 21.75, f_num2 = 13.45, f_num1 + f_num2 = 35.2,不管是从常识仍是理论角度都不难理解。
下面咱们运行一下程序,验证咱们的猜想正不正确:编程

f_num1 = 21.750000
f_num2 = 13.450000
f_num1 + f_num2 = 35.200001

f_num1f_num2的结果和咱们预想的同样,之因此后面多了四个0,是由于%f默认保留6位有效数字。可是f_num1 + f_num2的结果是什么鬼,这个35.200001是从哪里来的?
是否是一会儿颠覆了咱们的认知?
惊不惊喜,意不意外,刺不刺激?是否是发现自从学了C语言,连简单的算术都不会算了?
别急,还有更令你崩溃的。bash

若是是C++呢

下面咱们看看以上程序的C++版本:spa

#include<iostream>
using namespace std;

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        cout << "f_num1 = " << f_num1 << endl;
        cout << "f_num2 = " << f_num2 << endl;
        cout << "f_num1 + f_num2 = " << f_num1 + f_num2 << endl;
        return 0;
}

直接来看输出结果吧:code

f_num1 = 21.75
f_num2 = 13.45
f_num1 + f_num2 = 35.2

很神奇是否是?由于这个结果看起来正常多了。
看到这里,相信咱们的内心都有老大一个疑问:为何C程序和C++程序对一样的数字处理,输出的结果却不同的?cout到底作了些什么?内存

cout的神奇之处

为了验证cout对浮点数的处理,咱们不妨看一下下面的程序:编译器

#include <iostream>
using namespace std;

int main(void)
{
        float num1 = 5;
        float num2 = 5.00;
        float num3 = 5.14;
        float num4 = 5.140000;
        float num5 = 5.123456;
        float num6 = 5.987654321;
        cout << "num1 = " << num1 << endl;
        cout << "num2 = " << num2 << endl;
        cout << "num3 = " << num3 << endl;
        cout << "num4 = " << num4 << endl;
        cout << "num5 = " << num5 << endl;
        cout << "num6 = " << num6 << endl;

        return 0;
}

看结果来分析比较直观,运行以上程序,结果以下:io

num1 = 5
num2 = 5
num3 = 5.14
num4 = 5.14
num5 = 5.12346
num6 = 5.98765

num1num2num3num4这两组结果能够知道,cout对于float类型数值小数点后面的0是直接省去了的(这点和C语言格式化输出的%g有点像)。
num5num6两组结果不难分析出,cout对于浮点型数值,最多保留6位有效数字。
以上是cout处理浮点数时的特色,应该记住。
事实上,咱们使用iostream库里的cout.setf不难使cout恢复精度。咱们对上面的代码修改以下:编译

#include<iostream>
using namespace std;

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        cout.setf(ios_base::fixed, ios_base::floatfield);       
        cout << "f_num1 = " << f_num1 << endl;
        cout << "f_num2 = " << f_num2 << endl;
        cout << "f_num1 + f_num2 = " << f_num1 + f_num2 << endl;
        return 0;
}

输出的结果就与C语言版本如出一辙了:class

f_num1 = 21.750000
f_num2 = 13.450000
f_num1 + f_num2 = 35.200001

答案呼之欲出

文章写到这里,相信你已经看出来问题的所在了。
不错,之因此结果不同,正是因为精度引发的!
让咱们回顾一下官方教材里关于float精度的描述:

浮点型和表示单精度、双精度和扩展精度值。 C++标准指定了一个浮点数有效位数的最小值,然而大多数编译器都实现了更高的精度。 一般, float以一个字(32比特)来表示, double以2个字(64比特)来表示, long double 以3或4个字(96或128比特)来表示。通常来讲,类型 floatdouble分别有7和16个有效位;类型 long double则经常被用于有特殊浮点需求的硬件,它的具体实现不一样,精度也各不相同。( 《C++ Primer第五版》

由以上描述,咱们不难知道,对于float来讲,最多只有7个有效位,这也就意味着,当实际存储的精度大于float的精度范围时,就会出现精度丢失现象。
为了进一步佐证上述问题,咱们不妨将float的数值放大10亿倍,看看里面存储的值究竟是多少:

#include<iostream>
using namespace std;

int main(void)
{
        float f_num1 = 21.75;
        float f_num2 = 13.45;
        cout.setf(ios_base::fixed, ios_base::floatfield);
        int billion = 1E9;
        float f_num10 = f_num1 * billion;
        float f_num20 = f_num2 * billion;
        cout << "f_num1 = " << f_num1 << endl;
        cout << "f_num2 = " << f_num2 << endl;

        cout << "f_num10 = " << f_num10 << endl;
        cout << "f_num20 = " << f_num20 << endl;
        return 0;
}

以上程序运行结果以下:

f_num1 = 21.750000
f_num2 = 13.450000
f_num10 = 21749999616.000000
f_num20 = 13449999360.000000

由此咱们不难推断,21.75在实际存储时,并非存储的21.75,而是21.749999616,一样的,12.45存储的是12.449999360,这样计算出来以后天然就会形成结果的不正确。

再看一个例子

咱们再来看一个精度丢失形成运算结果不正确的例子。

#include<iostream>
using namespace std;

int main(void)
{
        float num1 = 2.3410E23;
        float num2 = num1 + 1.0f;
        cout << "num2 - num1 = " << num2 - num1 << endl;
        return 0;
}

若是精度不丢失,运算结果应该为1才对,但是由于精度丢失,致使最后的加1实际和没加效果同样,计算出来的结果是0。

num2 - num1 = 0

怎么解决

那么,既然float有这么多稀奇古怪的问题,应该怎么去解决和避免呢?

首先,固然推荐你们在编程时尽可能使用高精度的浮点类型

好比double就比float精度要高,不少时候,使用double可以避免不少问题,好比本文一开始提到的问题,若是使用double就能完美解决:

#include <stdio.h>

int main(void)
{
        double f_num1 = 21.75;
        double f_num2 = 13.45;
        printf("f_num1 = %lf\n", f_num1);
        printf("f_num2 = %lf\n", f_num2);
        printf("f_num1 + f_num2 = %lf\n", f_num1 + f_num2);

        return 0;
}

你们能够本身运行一下看看结果。
double类型能够解决大部分精度丢失问题,基本上知足平常使用了,可是仍然不能避免精度丢失(double也有精度限制),这时候就须要想另外的方法来解决了。

万能的cout

前面提到过,cout实际上是能够解决这种精度丢失问题的,因此若是不是对效率要求太高或者要求格式化输出(其实cout也能够实现格式化输出,此处不详细展开)必须使用printf,在编写C++程序时,建议使用cout代替printf

写在最后

本文只是简单的介绍了一下浮点型数值的精度问题,若是要深刻细究,确定不止这么多内容,好比浮点型数值在内存中是如何存储的?在字节里是如何分布 的?这才是真正核心的原理部分。在这里只浅尝辄止地讲述了一下,但相信阅读者已经对精度问题有了一个初步的认识。

相关文章
相关标签/搜索