衷心建议读者阅读源码,这篇内容比较简单。java
openJDK9开始,String的底层实现不同了,具体内容以下。数组
先来看下openJDK8的String的底层,以下图1.1所示:ui
图1.1 底层上使用的是char[],即char数组编码
每一个char占16个bit,Character.SIZE的值是16。spa
图2.1 openJDK9的底层上使用byte[]设计
openJDK9中这么设计的缘由,是由于大部分的String实际上是Latin-1,若是熟悉ASCII之类的编码就好理解了,Latin-1只是占有了不多的bit位,用char来存储浪费了不少的空间。3d
openJDK9中,字符若是是Latin-1,那么只用一个byte来存储,不然用俩个byte来存储。图2.1中的coder的值只有俩个,即LATIN1或者UTF16,以下图2.2所示code
图2.2blog
来看个有特色的方法,charAt(index),在openJDK9上是怎么实现的,以下图2.3所示,时序图以下图2.4所示:继承
图2.3 openJDK9中charAt(index)的实现
图2.4
注:图2.4中步骤3和步骤5是if-else的关系,没怎么画对。
图2.5 StringLatin1的charAt的实现
图2.6 StringUTF16中charAt的实现
注:图2.6中StringUTF16的charAt实现较为复杂,由于它要从byte[]数组中取出俩个byte,组为char。
openJDK9中,AbstractStringBilder的底层上也是用了byte[],以下图3.1所示:
图3.1 AbstractStringBuilder的底层上也是byte[]
AbstractStringBuilder的底层上使用byte[],意味着StringBuilder和StringBuffer用的也是byte[],为何这么说,由于StringBuilder和StringBuffer继承自AbstractStringBuilder。
建议读者阅读源码。