用Java这么多年，这些秘密你知道吗？

时间 2019-11-15

标签 java 多年这些秘密知道栏目 Java 繁體版

原文原文链接

摘要：java

若是您是Java开发人员，那么这些问题可能会让您在某个时刻头痛不已。继续阅读以了解如何处理这5个棘手的秘密。编程

Java是一个拥有悠久历史的大型语言。在二十多年的时间里，语言中蕴含着许多功能，其中一些功能对其改进有很大贡献，另外一些功能却极大地简化了它。在后一种状况下，这些功能中的不少功能都滞留在这里，而且为了向后兼容而留在这里。在本系列的前一篇文章中，咱们探讨了该语言的一些奇怪特征，这些特征在平常实践中可能不会使用。在这篇文章中，咱们将介绍一些有用但经常被忽略的语言功能，以及一些有趣的特性，若是忽略，可能会引发严重的骚动。缓存

对于这些秘密中的每个，重要的是要注意它们中的一些，例如数字下划线和缓存自动装箱在应用程序中多是有用的，可是其余的（如单个Java文件中的多个类）已被降级到backburner一个缘由。所以，仅仅由于语言中存在的功能并不意味着它应该被使用（即便它不被弃用）。相反，判断应该用于什么时候应用这些隐藏功能。在研究好的，坏的和丑陋的以前，咱们先从语言的特性开始，若是忽略这些语言会致使一些严重的错误：指令从新排序。安全

1.指令能够从新排序性能优化

因为多处理芯片数十年前进入计算环境，多线程已成为大多数不平凡的Java应用程序中不可或缺的部分。不管是在多线程超文本传输协议（HTTP）服务器仍是大数据应用程序中，线程都容许使用强大的中央处理单元（CPU）提供的处理预算同时执行工做。尽管线程是CPU使用率的重要组成部分，但它们可能会很是棘手，并且它们的错误使用可能会在应用程序中注入一些不合适且难以调试的错误。服务器

例如，若是咱们建立一个打印变量值的单线程应用程序，咱们能够假设咱们在源代码中提供的代码行（更准确地说，每条指令）都是按顺序执行的，从第一行开始并以最后一行结束。遵循这个假设，下面的代码片断将致使4 打印到标准输出中应该不使人惊讶：多线程

虽然它可能会出现的值 1 被分配给变量 x 第一和而后的值 3 被分配到 y，这可能不老是这样的状况。仔细检查后，前两行的顺序不会影响应用程序的输出：若是 y 首先分配哪一个位置，那么 x系统的行为不会改变。咱们仍然会看到 4 打印到标准输出。使用这种观察，编译器能够根据须要安全地从新排序这两个指令，由于它们的从新排序不会改变系统的总体行为。当咱们编译咱们的代码时，编译器会这样作：只要它不改变系统的可观察行为，就能够自由地对上述指令进行从新排序。架构

尽管对上述命令从新排序彷佛是徒劳无功，但在许多状况下，从新排序可能容许编译器进行一些很是明显的性能优化。例如，假设咱们有下面的代码片断，其中咱们 x 和 y 变量在交错的方式递增两次：并发

8不管编译器执行的任何优化如何，都应打印此片断，但请留下上述说明以便进行有效的优化。若是编译器将增量从新排列为非交错方式，则能够彻底删除它们：编程语言

实际上，编译器可能会更进一步，并简单地内联 print语句中的值， x 并 y删除将每一个值存储在变量中的开销，但为了演示的目的，只需说从新排序指令就能够了编译器会对性能作出一些重大改进。在单线程环境中，这种从新排序对应用程序的可观察行为没有任何影响，由于当前线程是惟一一个能够看到x 和 y，但在多线程环境中，这是否是这种状况。因为有一个连贯的内存视图，一般是不须要的，所以须要CPU的大量开销（请参阅缓存一致性），CPU一般会放弃一致性，除非被指示这样作。一样，Java编译器能够自由地优化代码，以便重排序能够发生，即便多线程读取或写入相同的数据，除非另有指示。

在Java中，这强加了指令的偏序排序，由发生前关系表示，其中hb（x，y）表示指令x在y以前发生。在这种状况下，发生 -事实上并不意味着没有发生指令的从新排序，而是说，x在y以前达到了一致状态（即在执行y以前执行了全部对x的修改而且可见）。例如，在上面的代码片断中，变量而且必须达到它们的终端值（在和上执行的全部计算的结果） xy x y）在执行印刷声明以前。在单线程和多线程环境中，每一个线程中的全部指令都是以先发生的方式执行的，所以当数据不是从一个线程发布到另外一个线程时，咱们从不会遇到从新排序问题。在发布发布（例如在两个线程之间共享数据）时，可能会出现很是潜在的问题。

例如，若是咱们执行如下代码（来自Java Concurrency in Practice，第340页），那么对具备并发经验的开发人员来讲，线程交织可能会致使（0,1），（1,0）或（1,1）打印到标准输出; 可是，（0,0）因为从新排序也不是不可能的。

因为每一个线程中的指令就不会有以前发生彼此之间的关系，他们能够自由地从新排序。例如，线程 one 可能在执行x = b 以前 a = 1 和以后实际执行，线程 other 可能会在y = a 以前执行 b = 1 （由于在每一个线程的上下文中，这些指令的执行顺序可有可无）。若是这两种再排序发生，结果多是（0,0）。请注意，这不一样于交错，其中线程抢占和线程执行顺序会影响应用程序的输出。交错只能致使（0,1），（1,0）或（1,1）被打印：（0,0）是从新排序的惟一结果。

为了强制两个线程之间发生以前发生的关系，咱们须要强制同步。例如，下面的代码片断删除了致使（0,0）结果的从新排序的可能性，由于它在两个线程之间施加了一个before-before关系。但请注意，（0,1）和（1,0）是此代码段中惟一可能的两种结果，具体取决于每一个线程的运行顺序。例如，若是线程 one 首先启动，结果将为（0,1），但若是线程 other 先运行，结果将为（1,0）。

通常来讲，有几种明确的方式来强加一种先发生的关系，包括（从包文档中引用）： java.util.concurrent

线程中的每一个动做都发生在该线程中的每一个动做以前，该动做稍后会按程序的顺序进行。

监视器的解锁（同步块或方法退出）发生在相同监视器的每一个后续锁定（同步块或方法输入）以前。而且由于发生以前的关系是可传递的，因此在解锁以前的线程的全部动做发生 - 在任何监视的线程锁定以后的全部动做以前。

在相同字段的每次后续读取以前发生对volatile 字段的写入。写入和读取字段具备与进入和退出监视器相似的内存一致性效果，但不须要互斥锁定。volatile

在启动线程中的任何操做以前，都会发生在线程上启动的调用。

在任何其余线程从该线程上的链接成功返回以前，线程中的全部操做都会发生。

在以前发生偏序关系是一个复杂的话题，但我只想说，交织不是能够在并发程序致使错误偷偷摸摸惟一的困境。在任何状况下，在两个或多个线程之间共享数据或资源的状况下，volatile必须使用某些同步机制（不管是synchronized，锁定，原子变量等）来确保数据正确共享。有关更多信息，请参见Java语言规范（JLS）的第17.4.5节和实践中的Java并发。

下划线可用于数字

不管是在计算机仍是在纸笔数学中，大量的数字都很难读懂。例如，试图辨别1183548876845其实是“1万亿1,853亿548万876万845”多是很是乏味的。值得庆幸的是，英语数学包括逗号分隔符，它容许一次将三位数字分组在一块儿。例如，如今更明显的是，1,183,548,876,845表明超过一万亿美圆的数字（经过计算逗号的数量）。

不幸的是，在Java中表示这么大的数字每每是件麻烦事。例如，在程序中将这些大数字表示为常量并不罕见，以下面的代码片断所示，该代码片断显示了上面的数字：

虽然这足以实现咱们打印大量数据的目标，但不言而喻，咱们创造的常量缺少美感。值得庆幸的是，自从Java开发工具包（Java Development Kit，JDK）7以来，Java已经引入了一个与逗号分隔符相同的内容：下划线。能够按照与逗号彻底相同的方式使用下划线，将数字组分开以提升大数值的可读性。例如，咱们能够重写上面的程序，以下所示：

一样，因为逗号使得咱们的原始数学值更易于阅读，如今咱们能够更容易地读取Java程序中的大数值。下划线也可用于浮点值，如如下常数所示：

还应该注意的是，下划线能够放置在一个数字中的任意点（不只仅是分隔三个数字的组），只要它不是前缀，后缀，与浮点值中的小数点相邻，或者与x 十六进制值相邻。例如，如下全部内容都是Java中的无效数字：

尽管这种用于分隔数字的技术不该该被过分使用，理想状况下，它只能以与英语数学中的逗号相同的方式使用，或者在小数位后以浮点值分隔三组数字 - 它能够帮助辨别之前不可读的数字。有关数字下划线的更多信息，请参阅Oracle的数字文字文档中的Underscore。

3. Autoboxed整数缓存

因为原始值不能用做对象引用和做为正式泛型类型参数，所以Java引入了原始值的盒装对象的概念。这些装箱值重要的是包装原始值 - 从基元建立对象 - 容许它们用做对象引用和正式泛型类型。例如，咱们能够按如下方式填充一个整数值：

实际上，原始int 500 被转换为一个类型的对象 Integer 并存储在其中 myInt。该处理称为自动装箱，由于自动执行转换以将原始整数值 500 转换为类型的对象Integer。实际上，这种转换至关于如下内容（请参阅自动装箱和取消装箱以获取更多关于原始代码段和下面代码段等效性的信息）：

既然 myInt 是一个类型的对象Integer，咱们会指望将它的相等性与Integer 包含500 使用 == 操做符的另外一个对象进行比较应该会致使false，由于两个对象不是同一个对象（== 操做符的标准含义）; 可是调用 equals 这两个对象应该会致使true，由于这两个 Integer 对象是表明相同整数（即，）的值对象500：

此时，自动装箱操做彻底按照咱们预期任何价值对象的行为。若是咱们用较小的数字尝试这种状况会发生什么？例如，25：

使人惊讶的是，若是咱们尝试这样作 25，咱们Integer 能够经过identity（==）和value来看到这两个对象是相等的。这意味着这两个 Integer 对象其实是同一个对象。这种奇怪的行为实际上不是一个疏忽或错误，而是一个有意识的决定，如第5.1.7节所述。的JLS。因为许多自动装箱操做都是在小数字（下127）下执行的，所以JLS指定缓存了和 Integer 之间的值（包括）。这反映在包含此缓存的JDK 9源代码中：-128127Integer.valueOf

若是咱们检查源代码IntegerCache，咱们收集一些很是有趣的信息：

虽然这段代码看起来很复杂，但实际上很简单。根据JLS的第5.1.7节，缓存Integer 值的包含下限始终设置为-128，但包含的上限可由Java虚拟机（JVM）配置。默认状况下，上限被设定为（根据JLS 5.1.7），但它能够被配置成任何数量的更大的比大于最大整数值或更小。理论上，咱们能够设置上限。127 127500

在实践中，咱们可使用java.lang.Integer.IntegerCache.high VM属性完成此操做。例如，若是咱们基于500 with 的自动装箱从新运行原始程序 -Djava.lang.Integer.IntegerCache.high=500，则程序行为会发生变化：

通常状况下，除非有严重的性能需求，不然不该将VM调整为更高的 Integer 缓存值。此外，的盒装形式 boolean，char，short，和 long （即Boolean，Char， Short和 Long）也被缓存，但一般都不会有VM设置来改变它们的缓存上限。相反，这些界限一般是固定的。例如， Short.valueOf 在JDK 9中定义以下：

有关自动装箱和缓存对话的更多信息，请参阅JLS的5.1.7节，以及为何128 == 128返回false但127 == 127在转换为Integer包装时返回true？

4. Java文件能够包含多个非嵌套类

一个广泛接受的规则是 .java 文件必须只包含一个非嵌套类，而且该类的名称必须与该文件的名称相匹配。例如， Foo.java 只能包含一个名为的非嵌套类Foo。虽然这是一项重要的作法和公认的惯例，但这并不是彻底正确。特别是，它实际上做为Java编译器的实现决策留下，无论是否强制限制文件的公共类必须与文件名相匹配。根据JLS第7.6节的规定：

在实践中，大多数编译器实现强制执行此限制，但在此定义中也有一个限定条件：该类型被声明为public。所以，经过严格的定义，这容许Java文件包含多个类，只要最多一个类是公共的。换句话说，实际上，全部的Java编译器都强制限制顶级公共类必须匹配文件的名称（不考虑 .java 扩展名），这限制了Java文件拥有多个公共顶级类（由于只有一个这些类能够匹配文件的名称）。因为此语句仅限于公共类，因此只要最多只有一个类是公共的，就能够将多个类放置在Java源代码文件中。

例如，Foo.java即便它包含多个类（但只有一个类是public类，而且公共类与该文件的名称相匹配），如下文件（named ）仍然有效：

若是咱们执行这个文件，咱们会看到10 打印到标准输出的值，这代表咱们能够实例化并与Bar 类（第二个但在咱们的Foo.java 文件中非公共类）进行交互，就像咱们任何其余类同样。咱们也能够Bar 从另外一个Java文件（Baz.java）中与类进行交互，只要它包含在同一个包中，由于 Bar 类是包私有的。所以，如下 Baz.java 文件打印 20 到标准输出：

尽管Java文件中可能有多个类，但这不是一个好主意。在每一个Java文件中只有一个类是常见的约定，违反这个约定会给其余开发人员读取文件带来一些困难和挫折。若是文件中须要多个类，则应使用嵌套类。例如，咱们能够Foo.java 经过嵌套Bar 类轻松地将文件减小到单个顶级类（由于Bar 类不依赖于特定的实例，所以使用静态嵌套 Foo）：

通常而言，应避免单个Java文件中的多个非嵌套类。有关更多信息，请参阅 Java文件是否能够有多个类？

5. StringBuilder用于字符串链接

字符串链接是几乎全部编程语言的常见部分，容许将多个字符串（或对象和不一样类型的基元）合并为一个字符串。Java中字符串链接复杂化的一个警告是不可变性Strings。这意味着咱们不能简单地建立一个 String 实例并不断追加到它。相反，每一个附加产生一个新的 String 对象。举例来讲，若是咱们看看 concat(String) 米的ethod String，咱们看到一个新的 String 实例制做：

若是将这种技术用于字符串链接，String 则会产生大量中间实例。例如，如下两行在功能上是等同的-第二行生成两个 String 实例只是为了执行级联：

虽然这可能看起来像是一个很小的代价来支付字符串链接，但这种技术在大规模使用时会变得难以维系。例如，如下内容会浪费地建立1,000个 String 永远不会使用的String 实例（建立1,001个实例并仅使用最后一个实例）：

为了减小String 为链接建立的浪费实例的数量， JLS的第15.18.1节提供了有关如何实现字符串链接的强烈建议：

a不是建立中间String 实例，而是将 a StringBuilder 用做缓冲区，从而容许添加无数个 String 值直到String 须要结果为止。这确保只String 建立一个实例：结果。此外，StringBuilder 建立了一个实例，可是这种组合开销要比String 建立的个别实例要少得多。例如，咱们上面写的循环串联在语义上等同于如下内容：

而不是建立1,000个浪费的 String 实例，只建立一个 StringBuilder 和一个 String实例。尽管咱们能够手动编写上面的代码片断而不是使用串联（经过 += 运算符），但二者都是等价的，而且没有性能增益。在许多状况下，使用字符串链接而不是明确的 StringBuilder，在语法上更容易，所以是首选。无论选择如何，重要的是要知道Java编译器会尽量提升性能，所以，试图过早地优化代码（例如经过使用显式 StringBuilder 实例）可能会以牺牲可读性为代价提供不多的收益。

结论

Java是具备历史传奇的大型语言。多年来，这门语言有数不清的增长，可能还有不少错误的增长。这两个因素的结合致使了语言的一些很是奇特的特征：一些好，一些坏。其中一些方面（如数字下划线，缓存自动装箱和字符串级联优化）对于任何Java开发人员来讲都是很重要的，而单个Java文件中诸如类的多样性等功能已被降级到已弃用的架构。其余的，好比不一样步指令的从新排序，若是处理不当，可能会致使一些很是繁琐的调试。

在此我向你们推荐一个架构学习交流群。交流学习群号： 744642380，里面会分享一些资深架构师录制的视频录像：有Spring，MyBatis，Netty源码分析，高并发、高性能、分布式、微服务架构的原理，JVM性能优化、分布式架构等这些成为架构师必备的知识体系。还能领取免费的学习资源