Java字符串之JDK 6和JDK 7中substring的原理及区别

String是Java中一个比较基础的类,每个开发人员都会常常接触到。并且,String也是面试中常常会考的知识点。String有不少方法,有些方法比较经常使用,有些方法不太经常使用。今天要介绍的subString就是一个比较经常使用的方法,并且围绕subString也有不少面试题。面试

substring(int beginIndex, int endIndex)方法在不一样版本的JDK中的实现是不一样的。了解他们的区别能够帮助你更好的使用他。为简单起见,后文中用substring()表明substring(int beginIndex, int endIndex)方法。数组

substring() 的做用

substring(int beginIndex, int endIndex)方法截取字符串并返回其[beginIndex,endIndex-1]范围内的内容。性能

String x = "abcdef";
x = x.substring(1,3);
System.out.println(x);

输出内容:this

bc

调用substring()时发生了什么?

你可能知道,由于x是不可变的,当使用x.substring(1,3)对x赋值的时候,它会指向一个全新的字符串:spa

然而,这个图不是彻底正确的表示堆中发生的事情。由于在jdk6 和 jdk7中调用substring时发生的事情并不同。设计

JDK 6中的substring

String是经过字符数组实现的。在jdk 6 中,String类包含三个成员变量:char value[]int offsetint count。他们分别用来存储真正的字符数组,数组的第一个位置索引以及字符串中包含的字符个数。code

当调用substring方法的时候,会建立一个新的string对象,可是这个string的值仍然指向堆中的同一个字符数组。这两个对象中只有count和offset 的值是不一样的。对象

下面是证实上说观点的Java源码中的关键代码:blog

//JDK 6
String(int offset, int count, char value[]) {
    this.value = value;
    this.offset = offset;
    this.count = count;
}

public String substring(int beginIndex, int endIndex) {
    //check boundary
    return  new String(offset + beginIndex, endIndex - beginIndex, value);
}

JDK 6中的substring致使的问题

若是你有一个很长很长的字符串,可是当你使用substring进行切割的时候你只须要很短的一段。这可能致使性能问题,由于你须要的只是一小段字符序列,可是你却引用了整个字符串(由于这个很是长的字符数组一直在被引用,因此没法被回收,就可能致使内存泄露)。在JDK 6中,通常用如下方式来解决该问题,原理其实就是生成一个新的字符串并引用他。索引

x = x.substring(x, y) + ""

关于JDK 6中subString的使用不当会致使内存系列已经被官方记录在Java Bug Database中:

内存泄露:在计算机科学中,内存泄漏指因为疏忽或错误形成程序未能释放已经再也不使用的内存。 内存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,致使在释放该段内存以前就失去了对该段内存的控制,从而形成了内存的浪费。

JDK 7 中的substring

上面提到的问题,在jdk 7中获得解决。在jdk 7 中,substring方法会在堆内存中建立一个新的数组。

Java源码中关于这部分的主要代码以下:

//JDK 7
public String(char value[], int offset, int count) {
    //check boundary
    this.value = Arrays.copyOfRange(value, offset, offset + count);
}

public String substring(int beginIndex, int endIndex) {
    //check boundary
    int subLen = endIndex - beginIndex;
    return new String(value, beginIndex, subLen);
}

以上是JDK 7中的subString方法,其使用new String建立了一个新字符串,避免对老字符串的引用。从而解决了内存泄露问题。

因此,若是你的生产环境中使用的JDK版本小于1.7,当你使用String的subString方法时必定要注意,避免内存泄露。

相关文章
相关标签/搜索