base64编码处理大文件

时间 2019-11-12

原文原文链接

在作项目的时候遇到须要将文件转为base64编码，并存储在文件中。程序员

在将文件转为base64编码是会将文件读入内存，进行base64编码，输出到文件中。代码入下：编码

　　 FileInputStream stream = new FileInputStream("D:\\桌面\\程序员-第4版.pdf");
        ByteArrayOutputStream out = new ByteArrayOutputStream(1024);
        byte[] b = new byte[1024];
        int n;
        while ((n = stream.read(b)) != -1) {
            out.write(b, 0, n);
        }
        stream.close();
        out.close();
        System.out.println(new String(Base64.encodeBase64(out.toByteArray())));

　　可是大文件在进行base64编码的时候就会遇到OOM（OOM为out of memory的简称，称之为内存溢出）。.net

　　产生OOM的缘由：code

文件太大，超出了内存
文件能够正常读入内存，因为base64编码后的文件比原来的文件大1/3，在编码的过程当中超出内存

因为3个常规字符能够转换为4个base64编码字符，因此使用3的公倍数做为缓冲区大小。blog

因此在对大文件进行base64编码时能够采用分段编码，进行输出。代码入下：内存

//使用分段上传的读取文件的方式将大文件转换为base64编码数据
        ByteArrayOutputStream os1 = new ByteArrayOutputStream();
        InputStream file1 = new FileInputStream("D:\\桌面\\程序员-第4版.pdf");
        byte[] byteBuf = new byte[3 * 1024 * 1024];
        byte[] base64ByteBuf;
        int count1; //每次从文件中读取到的有效字节数
        while ((count1 = file1.read(byteBuf)) != -1) {
            if (count1 != byteBuf.length) {//若是有效字节数不为3*1000，则说明文件已经读到尾了，不够填充满byteBuf了
                byte[] copy = Arrays.copyOf(byteBuf, count1); //从byteBuf中截取包含有效字节数的字节段
                base64ByteBuf = Base64.encodeBase64(copy); //对有效字节段进行编码
            } else {
                base64ByteBuf = Base64.encodeBase64(byteBuf);
            }
            os1.write(base64ByteBuf, 0, base64ByteBuf.length);
            os1.flush();
        }
        file1.close();
        System.out.println(os1.toString());

　　以上代码是将编码后的数据输出至控制台。其实最好是将文件分段进行编码，分段输出，这样无论文件多大，均可以进行编码，而且不会OOM。如下是将文件输出至txt文档中：文档

 ByteArrayOutputStream os1 = new ByteArrayOutputStream();
        InputStream file1 = new FileInputStream("D:\\桌面\\程序员-第4版.pdf");
        byte[] byteBuf = new byte[3 * 1024 * 1024];
        byte[] base64ByteBuf;
        int count1; //每次从文件中读取到的有效字节数
        File file = new File("D:\\1.txt");
        while ((count1 = file1.read(byteBuf)) != -1) {
            if (count1 != byteBuf.length) {//若是有效字节数不为3*1000，则说明文件已经读到尾了，不够填充满byteBuf了
                byte[] copy = Arrays.copyOf(byteBuf, count1); //从byteBuf中截取包含有效字节数的字节段
                base64ByteBuf = Base64.encodeBase64(copy); //对有效字节段进行编码
            } else {
                base64ByteBuf = Base64.encodeBase64(byteBuf);
            }
            FileUtils.writeByteArrayToFile(file, base64ByteBuf, true); // 将转换后的数据写入文件中，该方法会自动建立文件
            os1.flush();
        }
        file1.close();

　　本文参考文档：https://blog.csdn.net/u014248939/article/details/53205030/get

base64解码大文件请参考：https://blog.csdn.net/GAMEloft9/article/details/88536661，没有实际操做，原理上应该是能够的。it