先看下面的方法,事先预测一下,通过split方法,按逗号进行分割为数组以后,生成的数组的长度是多少,目测不少人都以为是8,可是结果却出乎意料。是5而不是8.正则表达式
private static void testSplit() {数组
String ss = ",aa,bb,cc,dd,,,";ide
String[] array = ss.split(",");debug
System.out.println(array.length);//结果是5,而不是预想中的8指针
for (int i = 0; i < array.length; i++) {blog
System.out.println(array[i]);字符串
}源码
}it
而后就是正儿八经的运行结果图:class
能够看到,结果然的是5而不是咱们猜的8,这是为何呢?
缘由解析:
点进去看源码,debug一下,以下图:
能够看到,刚刚开始的时候,确实是有0-7,8个分割出来的东西存在,有三个是空字符串,""。不是null。不用担忧空指针异常。
而后 看到下面的继续走,if语句,就看到,他把这个list从尾部开始判断,若是这个list的后面的字符串的长度是0,那么这个resultSize就 减减,而后一直while循环,
直到不符合条件,那么list的下标是五、六、7的值就被抛弃了,而后新生的结果字符串数组,的大小就变成加工事后的长度,那么就变成了长度 5的数组。
list.subList(0, resultSize).toArray(result)
就是这句话啦。
他只是处理后面尾部的空字符串,不处理中间的空字符串和 开头的空字符串。
知道这个原理以后,那么这个 问题之后怎么变,你都了然于胸啦。
下面是又更新的
如今要求字符串
"aa12sas32sasa223sas12as12wqe"//去掉数字,而后弄成数组
"aa,,sas,,sasa,,,,sasas,,,"//去掉逗号,无论几个逗号,都去掉
"aa sas sa sa sas as "//去掉空格,也无论几个,
把他们给分解成数组,同时刨除掉不用的多余信息。
具体实现代码以下:
private static void testSplitPlus() {
String ss = "aa12sas32sasa223sas12as12wqe";
String[] array = ss.split("[\\d]+");
System.out.println(Arrays.toString(array));
ss = "aa,,sas,,sasa,,,,sasas,,,";
array = ss.split("[,]+");
System.out.println(Arrays.toString(array));
ss = "aa sas sa sa sas as ";
array = ss.split("[\\s]+");
System.out.println(Arrays.toString(array));
}
下面再看看这个split的源码。
public String[] split(String regex) {
return split(regex, 0);
}
不知道你看到没,那个regex,不就是正则表达式的意思嘛?
那就明白了,这个方法是支持正则表达式操做的。那上面的代码就好解释啦。
第一个[\\d]+这个解释就是\\是转义符,d表示数字,括起来后面的加号表示一个或者多个,那么就能够解释运行结果啦。
第二个[,]解释相似,就是逗号出现一次或屡次,
第三个,\\s,就是匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
而后下面,看运行结果。
这就是咱们要的结果啦。