substring(int beginIndex, int endIndex)在JDK6与JDK7中的实现方式不同,理解他们的差别有助于更好的使用它们。为了简单起见,下面所说的substring()指的就是substring(int beginIndex, int endIndex)方法。html
1.substring()是作什么的?java
substring(int beginIndex ,int endIndex)方法返回一个子字符串,返回的是从原字符串的beginIndex到endIndex-1之间的内容。数组
1
2
3
|
String x =
"abcdef"
;
x = x.substring(
1
,
3
);
System.out.println(x);
|
输出:性能
1
|
"bc"
|
2.当substring()被调用的时候,内部发生什么事?this
你或许会认为因为x是不可变的对象,当x被x.substring(1,3)返回的结果赋值后,它将指向一个全新的字符串以下图:spa
然而,这个图并不彻底正确,或者说并无彻底表示出java 堆中真正发生的事情。那么当调用substring()的时候到底发生的了什么事呢?JDK 6与JDK7的substring方法实现有什么不同呢?code
3.JDK6中的substring()htm
java中字符串是经过字符数组来支持实现的,在JDK6中,String类包含3个域,char[] value、int offset、int count。分别用于存储真实的字符数组、数组的偏移量,以及String所包含的字符的个数。对象
当substring()方法被调用的时候,它会建立一个新的字符串对象,可是这个字符串的值在java 堆中仍然指向的是同一个数组,这两个字符串的不一样在于他们的count和offset的值。内存
下面是jdk6中的原代码,是简化后只包含用来讲明这个问题的关键代码:
1
2
3
4
5
6
7
8
9
10
11
|
//JDK 6
String(
int
offset,
int
count,
char
value[]) {
this
.value = value;
this
.offset = offset;
this
.count = count;
}
public
String substring(
int
beginIndex,
int
endIndex) {
//check boundary
return
new
String(offset + beginIndex, endIndex - beginIndex, value);
}
|
4.jdk6中substring()将会致使的问题
若是你有一个很是长的字符串,可是你仅仅只须要这个字符串的一小部分,这就会致使性能问题(译注:可能会形成内存泄露,这个bug很早之前就有说起),由于你须要的只是很小的部分,而这个子字符串却要包含整个字符数组,在jdk6中解决办法就是使用下面的方法,它会指向一个真正的子字符串。
1
|
x = x.substring(x, y) +
""
|
5.JDK7中的substring()
在JDK7中有所改进,substring()方法在堆中真正的建立了一个新的数组,当原字符数组没有被引用后就被GC回收了.所以避免了上述问题.
1
2
3
4
5
6
7
8
9
10
11
|
//JDK 7
public
String(
char
value[],
int
offset,
int
count) {
//check boundary
this
.value = Arrays.copyOfRange(value, offset, offset + count);
}
public
String substring(
int
beginIndex,
int
endIndex) {
//check boundary
int
subLen = endIndex - beginIndex;
return
new
String(value, beginIndex, subLen);
}
|
译注: 在最新的Oralce JDK 6u45中,substring的实现方式已经改进了,不过我查到openjdk的6-b14就是原来的实现方式,有兴趣的能够查查具体是哪一个版改进的.