openJDK之JDK9的String

    衷心建议读者阅读源码,这篇内容比较简单。java

    openJDK9开始,String的底层实现不同了,具体内容以下。数组

1.openJDK8的String

    先来看下openJDK8的String的底层,以下图1.1所示:ui

               

                                         图1.1 底层上使用的是char[],即char数组编码

    每一个char占16个bit,Character.SIZE的值是16。spa

2.openJDK9中的String

                 

                                                  图2.1 openJDK9的底层上使用byte[]设计

 

    openJDK9中这么设计的缘由,是由于大部分的String实际上是Latin-1,若是熟悉ASCII之类的编码就好理解了,Latin-1只是占有了不多的bit位,用char来存储浪费了不少的空间。3d

    openJDK9中,字符若是是Latin-1,那么只用一个byte来存储,不然用俩个byte来存储。图2.1中的coder的值只有俩个,即LATIN1或者UTF16,以下图2.2所示code

                   

                                                                             图2.2blog

    来看个有特色的方法,charAt(index),在openJDK9上是怎么实现的,以下图2.3所示,时序图以下图2.4所示:继承

                 

                                                        图2.3 openJDK9中charAt(index)的实现

                     

                                                              图2.4

    注:图2.4中步骤3和步骤5是if-else的关系,没怎么画对。

          

                                               图2.5 StringLatin1的charAt的实现

          

                                                 图2.6 StringUTF16中charAt的实现

    注:图2.6中StringUTF16的charAt实现较为复杂,由于它要从byte[]数组中取出俩个byte,组为char。

3.openJDK9中的AbstractStringBuilder

    openJDK9中,AbstractStringBilder的底层上也是用了byte[],以下图3.1所示:

     

                                               图3.1 AbstractStringBuilder的底层上也是byte[]

    AbstractStringBuilder的底层上使用byte[],意味着StringBuilder和StringBuffer用的也是byte[],为何这么说,由于StringBuilder和StringBuffer继承自AbstractStringBuilder。

    建议读者阅读源码。

Reference:

  1. openJDK源码
  2. https://stackoverflow.com/questions/44178432/difference-between-compact-strings-and-compressed-strings-in-java-9/44179353
相关文章
相关标签/搜索