openJDK之JDK9的String

时间 2019-11-13

标签 openjdk jdk9 jdk string 栏目 Java 繁體版

原文原文链接

衷心建议读者阅读源码，这篇内容比较简单。java

openJDK9开始，String的底层实现不同了，具体内容以下。数组

1.openJDK8的String

先来看下openJDK8的String的底层，以下图1.1所示：ui

图1.1 底层上使用的是char[]，即char数组编码

每一个char占16个bit，Character.SIZE的值是16。spa

图2.1 openJDK9的底层上使用byte[]设计

openJDK9中这么设计的缘由，是由于大部分的String实际上是Latin-1，若是熟悉ASCII之类的编码就好理解了，Latin-1只是占有了不多的bit位，用char来存储浪费了不少的空间。3d

openJDK9中，字符若是是Latin-1，那么只用一个byte来存储，不然用俩个byte来存储。图2.1中的coder的值只有俩个，即LATIN1或者UTF16，以下图2.2所示code

图2.2blog

来看个有特色的方法，charAt(index)，在openJDK9上是怎么实现的，以下图2.3所示，时序图以下图2.4所示：继承

图2.3 openJDK9中charAt(index)的实现

图2.4

注：图2.4中步骤3和步骤5是if-else的关系，没怎么画对。

图2.5 StringLatin1的charAt的实现

图2.6 StringUTF16中charAt的实现

注：图2.6中StringUTF16的charAt实现较为复杂，由于它要从byte[]数组中取出俩个byte，组为char。

openJDK9中，AbstractStringBilder的底层上也是用了byte[]，以下图3.1所示：

图3.1 AbstractStringBuilder的底层上也是byte[]

AbstractStringBuilder的底层上使用byte[]，意味着StringBuilder和StringBuffer用的也是byte[]，为何这么说，由于StringBuilder和StringBuffer继承自AbstractStringBuilder。

建议读者阅读源码。