CSV全称是:Comma Separated Values (逗号分隔值)或者 Character Separated Values(字符分隔值)。其文件以纯文本形式存储表格数据(数字和文本)。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最多见的是逗号或制表符。每一行记录位于一个单独的行上,用回车换行符CRLF(也就是\r\n)分割。apache
对于excel来讲默认使用 ,进行分割数据。编辑器
每一行记录最后一个字段后不能跟逗号编码
每一行一条记录.net
列为空须要指定 ""3d
用回车换行符CRLF(\r\n)分割每条记录excel
纯文本,使用某个字符集,好比ASCII、Unicode、EBCDIC或GB2312code
采用 Apache 开源的 commons-csv 包,详细内容参考 官网orm
<dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-csv</artifactId> <version>1.7</version> </dependency>
- print(Object value); // 写入一个单元格数据
- printRecord(Iterable<?> values); // 写入一行数据
- printRecords(Iterable<?> values);// 写入多行数据
其余重载方法⬇️blog
/** * 导出 csv 文件 * [@param](https://my.oschina.net/u/2303379) out 输出流 * [@param](https://my.oschina.net/u/2303379) iter 数据 我这里传 List<List<Object>> 类型 * [@param](https://my.oschina.net/u/2303379) charset 字符集编码 * [@param](https://my.oschina.net/u/2303379) header 表头 */ public void exportCSVFile(OutputStream out, Iterable<?> iter, String charset, String... header) { try { // 写入bom, 防止中文乱码 byte[] bytes = {(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}; out.write(bytes); OutputStreamWriter osw = new OutputStreamWriter(out, charset); CSVFormat csvFormat = CSVFormat.EXCEL.withHeader(header); CSVPrinter csvPrinter = new CSVPrinter(osw, csvFormat); csvPrinter.printRecords(iter); csvPrinter.flush(); csvPrinter.close(); } catch (IOException e) { e.printStackTrace(); } }
List<List<Object>> lists = new ArrayList<>(); List<Object> list1 = new ArrayList<>(); list1.add("张三"); list1.add(18); list1.add("男"); lists.add(list1); List<Object> list2 = new ArrayList<>(); list2.add("李四"); list2.add(20); list2.add("女"); lists.add(list2); String[] header = {"姓名", "年龄", "性别"}; // 省略 out exportCSVFile(out, lists, "UTF-8", header);
文本编辑器打开字符串
张三,18,男
李四,20,女
使用 Excel 打开出现中文乱码
上面的示例代码采用的是写入 bom ,编码为 UTF-8 的方式解决的,也有其余方案是使用编码为 GBK。
用 Excel 打开后,日期格式会变成 ### 或者 2019/01/01 以及较大数字会变成科学技术法
写数据时加上制表符,一个制表符不够,就 2 个
不要调用 printRecords(); 方法,而是经过遍历数据调用 csvPrinter.print("\t"+ 数据 +"\t");
public void exportCSVFile(OutputStream out, Iterable<?> iter, String charset,String... header) { try { // 写入bom, 防止中文乱码 byte[] bytes = {(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}; out.write(bytes); OutputStreamWriter osw = new OutputStreamWriter(out, charset); CSVFormat csvFormat = CSVFormat.EXCEL.withHeader(header); CSVPrinter csvPrinter = new CSVPrinter(osw, csvFormat); Iterator<?> iterator = iter.iterator(); while (iterator.hasNext()) { Collection list = (Collection)iterator.next(); // 开始写一行数据 list.forEach(c->{ try { csvPrinter.print("\t" +c.toString() +"\t" ); } catch (IOException e) { e.printStackTrace(); } }); // 写完一行,须要换行 csvPrinter.println(); } csvPrinter.flush(); csvPrinter.close(); } catch (IOException e) { e.printStackTrace(); } }
注意: 添加了制表符以后,用文本编辑器打开后,格式就会变得很难看, 以下图所示:
写入的数据包含逗号,双引号等特殊字符时,导出的 csv 文件用文本编辑器打开,数据会用双引号包裹起来, 以下所示:
经过 Excel 修改 CSV 文件会出现兼容性问题