JDK9的新特性:String压缩和字符编码

简介

String的底层存储是什么?相信大部分人都会说是数组。若是要是再问一句,那么是以什么数组来存储呢?相信不一样的人有不一样的答案。java

在JDK9以前,String的底层存储结构是char[],一个char须要占用两个字节的存储单位。数组

听说是JDK的开发人员通过调研了成千上万的应用程序的heap dump信息,而后得出了一个结论:大部分的String都是以Latin-1字符编码来表示的,只须要一个字节存储就够了,两个字节彻底是浪费。大数据

听说他们用了大数据+人工智能,得出的结论由不得咱们不信。编码

因而在JDK9以后,字符串的底层存储变成了byte[]。人工智能

更多内容请访问 www.flydean.com

底层实现

先看下java9以前的String是怎么实现的:code

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
 
    //The value is used for character storage.
    private final char value[];
}

再看下java9中String的实现和一些关键的变量:开发

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
 
    /** The value is used for character storage. */
    @Stable
    private final byte[] value;

    private final byte coder;

    @Native static final byte LATIN1 = 0;
    @Native static final byte UTF16  = 1;

    static final boolean COMPACT_STRINGS;

    static {
        COMPACT_STRINGS = true;
    }

从代码咱们能够看到底层的存储已经变成了byte[]。字符串

再看一下coder变量,coder表明编码的格式,目前String支持两种编码格式LATIN1和UTF16。get

LATIN1须要用一个字节来存储。而UTF16须要使用2个字节或者4个字节来存储。博客

而COMPACT_STRINGS则是用来控制是否开启String的compact功能。默认状况下COMPACT_STRINGS功能是开启的。

若是咱们想关闭COMPACT_STRINGS功能则可使用-XX:-CompactStrings参数。

总结

本文讲解了新的String实现和COMPACT_STRINGS模式的关闭方法。

本文做者:flydean程序那些事

本文连接:http://www.flydean.com/jdk9-string-compact/

本文来源:flydean的博客

欢迎关注个人公众号:程序那些事,更多精彩等着您!

相关文章
相关标签/搜索