
咱们都知道,Java 语言中的类型分为两种:基本类型(primitive type)和引用类型(reference type),这不只是语言层面的特性,也由 JVM 内在实现支持
[1]
。
其中,基本类型指是的 8 种基本的数值类型:boolean、byte、char、int、short、long、float、double;而引用类型,指的是对程序中建立的对象的引用,能够理解为指向对象的指针或句柄。Java 号称一切皆是对象,很惋惜,这并非事实,基本类型就不是对象。
在你编写程序时,是否常常会遇到一些须要表达数值或其它类型值的场景?好比复数、向量、颜色值、坐标点、时间、日期等。这些值一般没法用基本类型来表达,一则它多是多个属性构成,二则针对值的一些操做或逻辑咱们但愿跟数据封装在一块儿,好比向量的点乘、叉乘、取模等。但若是使用对象来表达一样也会产生不少问题:
▐ 相等性比较
对这些对象的比较是有意义的,可是默认状况下 Java 对象比较的是地址,所以直接比较的结果一般不是咱们期待的行为:
▐ 可变性
对引用类型的赋值、方法传参等会生成多个引用,这些引用都指向同一个对象。这在一些状况下是没有问题的,但在某些场景下可能致使对象发生预期以外的变化。如:
上面的 case 比较简单,只要对 Date 的特性有些了解就不会犯这样的错误。但若是对象通过屡次传递,使用的位置离建立的位置很远的话,咱们就未必能这么谨慎了。这种问题,Martin Flower 称之为
aliasing bug[2]
。
▐ 性能
上面两点其实都容易解决,只是每一个实现须要写不少样板代码。须要比较的对象只要重写
equals()
和
hashCode
方法便可;对于可变性问题,能够将对象设计为不可变对象,在修改时返回一个深拷贝副原本供客户端操做。知足上述两种条件的对象,咱们能够称之为值对象。
那么,经过“对象”来实现咱们对这种数据结构的诉求,是不是最好的方式呢?
咱们知道,Java 中的对象一般是分配在堆上,经过引用来进行操做,不过这不是必然的。JVM 有一项技术叫
逃逸分析[3]
,能够在运行时分析出一个方法中建立的对象是否会逃逸到方法或线程外部,若是没有逃逸,能够进而执行一些编译优化,好比栈上分配、同步消除、标量替换等。若是一个对象被分配到栈上,就意味着当方法结束后就会自动销毁,省去了 GC 的开销,这对于优化应用内存占用和 GC 停顿时间来讲,无疑是个好消息;而标量替换意味着压根就不会建立对象,相关数据被替换成基本类型数据直接分配到栈上,不只省去了对象操做相关开销,也更利于 CPU 高速缓存或寄存器进行优化。
对于值对象来讲,通常极少有共享的需求,假如能直接在栈上进行分配,那么将省去对象的存储、访问和 GC 的成本,对程序性能很是有利。不过进行逃逸分析也是有成本的,若是在语言层面直接支持的话,就能够进一步减小编译时分析的开销。不过,目前 Java 语言还作不到这一点。
当一门编程语言为上述类型的数据结构提供内在支持时,该类型可称之为值类型。而对于知足上述诉求的实例,不管是基于值类型实现仍是普通对象类型实现,咱们均可以称之为值对象。
▐ Java
上面已经说过,Java 语言层面原生并不支持值类型。不过,它提供了许多具备值类型特色的类,好比:8个基本类型对应的封装类、String、BigDecimal 等,这些类的共同特色之一就是不可变性,同时也都对比较操做作了实现,所以均可看做值对象。另一个应该设计为不可变、但实际可变的类是 java.util.Date 类,也由于如此,Date 类饱受诟病。在 Java 8 中官方正式推出新的 时间/日期 API,试图取代 Date 相关接口,这些新的类所有被设计成了不可变类。
对于Java 是否应该从语言层面支持值类型的讨论由来已久,好比这篇
JEP提案[4]
早在 2012 时就提议支持值对象;oracle 论坛上的这篇
博客[5]
也对如何实现值对象作了探讨。最近有两篇提案,一个提出了
Primitive Object
[6]
的概念,可算是值类型的一种实现;另一篇提议
基于Primitive Object统一基本类型与对象类型[7]
。不过,这两个提案仍处于
Submitted
阶段(JEP 提案从提出到发布的流程有几个阶段,能够看
这里
[8]
Process states 一节),可否被采纳、实现乃至发布到正式版本,仍是未知之数。
▐ C++
C++ 中没有值对象这一律念,不过在建立对象时,容许开发者选择在堆上仍是在栈上建立。好比下面的示例代码,直接经过
A a;
的方式建立的对象是分配在栈上的,而经过
new A();
的方式建立的对象分配在堆上,而且返回一个指向该对象的指针。在栈上建立的对象在函数执行结束时会自动销毁。
更进一步,对 A 类型的对象进行赋值(34行)或方法传参(38行)时,会产生一次拷贝操做,生成一个新的对象,新对象的做用域分别为当前函数和被调函数,相应函数执行结束时也会被销毁。而对指针类型的对象进行赋值(43行)和方法传参(45行)时,尽管建立了新的指针对象,新的指针仍然指向相同的对象。
可见 C++ 中对类类型和指针类型的使用,分别具备值类型和引用类型的一些特色。
▐ C#
C# 语言中是明确的提出了
值类型[9]
这一律念的,struct 就是一种值类型。MSDN文档中说明:“默认状况下,在分配中,经过将实参传递给方法并返回方法结果来复制变量值。” 在赋值操做时,也一样会对对象进行拷贝。以下面的代码所示,咱们能够看到将 p1 赋值给 p2,p2 修改状态后,p1 中的数据仍然保持不变。
另外,在 C# 中值类型是分配在栈上的,值类型与引用类型之间能够进行转化,称之为装箱和拆箱,上面的 Java Primitive Object 提案彷佛也借鉴了 C# 的设计思想。
▐ 其它语言
其它编程语言对值类型的支持不尽相同。以函数式编程为例,大多数函数式编程语言中变量都是不可变的,所以在函数式语言中定义的数据结构均可看做是值类型。
尽管 Java 并无对值对象提供语言层面的类型支持,但这并不妨碍咱们在本身的代码中建立事实上的值对象。实际上值对象[10]的定义能够并不只限于相似向量、颜色值、坐标点这样一些使用范围。Martin Flower 认为,
值对象
在编程中的做用被极大的忽视了,善于值对象能够很是有效的简化你的系统代码;Vaughn Vernon 在《实现领域驱动设计》一书中甚至说,咱们应该尽可能使用值对象建模而不是实体对象。实际上,当提到“值对象”这个概念时,最多见的就是在 DDD(领域驱动设计)这个上下文中。
Eric Evans 在《领域驱动设计 软件核心复杂性应对之道》一书中提出了实体(Enity)与值对象(Value Object)的概念。Vaughn Vernon 在《实现领域驱动设计》中作了进一步阐述。
在 DDD 中,实体表明具备个性特征或须要区分不一样个体的对象,它具备惟一标识和可变性。对于实体对象,咱们首要考虑的并非其属性,而是能表明其本质特征的惟一标识,不管对象属性如何变化,它都是同一个对象,它的生命周期具备连续性,甚至对对象进行持久化存储而后基于存储来重建对象,它仍然是同一个对象的延续。
而值对象,它一般是一些属性的集合,是对对象的度量和描述。值对象应该是不可变的,当度量和描述改变时,能够用另一个值对象替换。值能够跟其它值对象进行相等性比较。
能够看到,在 DDD 中的值对象的定义跟咱们上面的描述很是类似。《实现领域驱动设计》对于值对象的阐述很是详尽,想要进一步了解的能够阅读该书第 6 章内容。
由于值对象一般设计为不可变对象,所以值对象的好处首先就是不可变对象的好处。另外在支持值类型的语言中,值对象的建立、操做、销毁会有更好的性能。
▐ 线程安全
在 Java 编程语言中,出现线程安全问题的必要条件有两个:对象状态被多个线程共享;对象状态可变。所以解决线程安全问题的思路也主要从几个方向出发:无状态;状态不可变;不共享状态;经过同步机制来序列化对象状态的访问。
而不可变对象状态是不变的,所以是线程安全的,能够放心应用到并发环境中,无需额外的同步机制在多个线程中共享。
▐ 避免 Alias Bug
Aliasing bug 的概念上文已经讲过,主要是指多个对象的引用被分享到多个环境中后,在某个环境的改动会致使从另一个环境中看到预期以外的变化。
最近咱们的项目中就遇到这样一个 bug,某个对象会被缓存到本地内存中,取出对象后,返回给 UI 层的某个属性值须要根据请求环境作一些判断与变动,因为未作防护性拷贝,致使变化污染了缓存对象,后面的请求出现错误的结果。
而不可变对象不容许修改属性值,任何状态的变化必须经过建立副原本实现,所以能够有效的避免该类 bug。
▐ 简化逻辑复杂程度
▐ 使你的设计更清晰
值对象与基础类型数据相比,富含业务语义,在任何使用到它的地方,其含义一看便知。它还能够封装跟数据相关的业务逻辑,避免为了复用代码而建立 util 类,更符合面向对象的思想。
▐ 可比较、能够被集合类使用
那么,如何在咱们的代码中建立不可变对象呢?咱们分为部份内容来说,第一部分是指导思想,第二部分是如何进行实践。
▐ 值对象建立指南
在 《Effective Java 第三版》 第 17 条 最小化可变性一节中,将不可变类的设计概括为五条原则:
第 二、三、4 点很容易理解。对第 1 点,也就是说对任何涉及状态变动的操做,都不能直接修改原始对象的状态,而是经过建立对象的副本,好比下面对复数对象的“加”操做:
对于第 2 点,确保类不能被继承,除了将类设为 final,还有一种方式是将构造方法设为 private,并向外提供静态工厂方法来建立实例。
而第 5 点的意思是,“若是你的类有任何引用可变对象的属性,请确保该类的客户端没法得到 对这些对象的引用”。举例而言,下面的 Period 类,尽管知足上面的 1~4 点,但因为其状态变量中包含了引用对象,引用对象经过构造方法与访问方法与外界共享,致使它的状态也会发生变化(第 7 行、第 10 行):
一个解决方案是,不使用 Date 对象,而是使用 Java 8 中提供的 LocalDate 对象,该对象是不可变的。另外一种方案,在引用共享的位置对对象进行拷贝。
进行防护性拷贝应在参数检查以前执行,以免参数检查可拷贝期间受其它线程对参数更改的影响。微信
必要时,对实现 serializable 接口的类进行反序列化重写 readObject 方法,以免字节码攻击。对于这一点,简单来说就是因为 Java 对象的反序列默认经过 readObject 方法重建对象,而不会调用咱们提供的构造方法,这使得攻击者能够经过修改字节码数据,从而绕开构造方法中的参数校验的防护性拷贝。具体能够看 《Effective Java 第三版》 第 88 条 保护性的编写 readObject 方法。
当构造方法参数过多时,能够借助 builder 设计模式
这一点可参照《Effective Java 第三版》 第 2 条。这里不展开了。
因为不变对象在修改数据时会进行拷贝,所以它的一个主要问题就是可能会建立过多的对象,这会带来性能问题。一个方案是,对可能会常常用到的对象提供公共的静态 final 常量。这一点,既能够经过公共的常量字段来实现,也能够经过静态工厂方法来实现。
须要重写 equals() 和 hashCode() 方法。至于为何以及如何实现,相信你们都知道了,就不展开讲了。
这一点也很好理解,既然值对象是不可变的,那么建立完成以后没有任何方法能够改变的状态,所以必须在构造时进行必要的合法性校验,使建立出来的对象知足其全部的不变性条件(Invariants)。
▐ 如何实现
有了指导思想,如何实现其实就一目了然了。只不过,要实现不可变对象,须要建立大量的样板代码,好比 equals() 和 hashCode() 方法的重写、builder 模式的建立等等。这些重复代码不只写起来费力,并且会使类的核心业务逻辑隐藏在大量的样板代码中,下降了类的可读性。所以,最好实现方式仍是借且代码生成工具。
(i) lombok @value 注解
lombok 库的 @value 注解能够很方便的帮咱们生成一个不可变的值对象类型。如:
若是咱们使用 Intellij IDEA 工具,而且安装了 lombok 插件,能够在源代码处 右键 -> Refactor -> Delombok -> All lombok annotations,来查看 lombok 注解处理器处理事后生成的字节码对应的源代码大概是什么样子。
这里有一点须要注意,lombok 工具对于引用类型不会帮咱们作防护性拷贝,所以假如咱们的构成组件包含可变对象,须要咱们本身去作防护性拷贝。作法很简单,只要提供咱们本身的构造方法和 get 方法,lombok 就不会再帮咱们生成对应的方法。
若是咱们要对参数进行合法性校验,也一样须要提供自定义的构造方法,在构造方法中添加校验逻辑。
(ii) lombok @Builder 注解
lombok 的 @Builder 注解很是强大,能够应用在类上、构造方法上,也能够应用在静态工厂方法上。在构建时未传入的参数为该类型的默认值。一样的,若是你须要校验,可提供自定义的全参数构造方法。
上面咱们提到过,对值对象的实例尽量的重用。若是咱们使用静态工厂方法,就能够实现这一点:
注意咱们把 @Builder 注解放在了
of()
静态工厂方法上面,同时将构造方法设为 private。经过查看生成的代码,发现 builder 的
build()
方法直接调用了该工厂方法。
(iii) lombok @With 注解
@Value 注解会将生成的类设为不可变,若是咱们须要修改对象的状态,怎么办?上面说过,修改状态须要建立拷贝。使用 @With 注解能够很方便的作到这一点。
(iv) 与 mapstruct 配合使用
在进行领域驱动设计时,咱们常常会在不一样的层或者模块之间使用不一样的对象,好比持久化层使用跟数据库纪录进行映射的 DO 对象,而在领域层使用更具备业务意义的领域对象。如何在对象之间进行属性的拷贝呢?能够有不少种选择,我最经常使用的是 mapstruct 工具,该工具很是强大,不只支持不一样名称、不一样类型字段的映射,还可使用表达式、方法调用等。
对于它咱们不作过多介绍,有兴趣能够看
这里[11]
。
在进行属性拷贝时,一般基于无参构造函数建立对象,而后设置对应属性。可是上面的类,咱们在实现不可变特性时,再也不提供无参构造函数。如何让 mapstruct 支持这种类呢?恭喜你,只要加了 @Builder 注解,什么都不须要作,mapstruct 已经内置提供了对 lombok @Builder 注解的支持。
至于使用其它手段的属性拷贝,我暂时没有去了解,熟悉的同窗能够参与讨论。
(v) json 反序列化
咱们知道,当使用 json 反序列化工具生成自定义类型的实例时,一般也是使用该类型的默认无参构造方法。假如没有该构造方法,运行时就会抛出异常。可是,咱们不但愿提供该构造方法来破坏对象的不可变性。怎么办呢?
这里又要祭出 lombok 的另外一法宝,@Jacksonized 注解。加上这一注解后,咱们的不可变对象就能够被 jackson json 库顺利的建立出来了(须要跟 @Builder 一块儿使用)。其实这个注解没什么复杂之处,能实现这点得益于 jackson json 库自己对 builder 模式的支持,@Jacksonized 注解只是按照 jackson json 的相关要求生成相关的 builder 类和方法而已。目前 fastjson 库彷佛不支持使用 builder 模式来建立对象,不知道后面有没有相关的计划。
本文经过一些简单的案例讨论了值类型与值对象的概念,而且探讨了不一样语言对值类型的支持状况。而后对于在 Java 语言中如何建立值对象给出了一些指导原则,并介绍了一些可用于快速实现值对象的工具。值对象的使用是一种很是有用的编程技巧,可使咱们的业务语义更加清晰,并有效的简化代码逻辑的复杂程度。所以,建议你们在本身的代码中多尝试使用值对象,相信在这个过程当中必然更有更深入的认识和感觉。
相关连接
[1].https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.2
[2]. https://martinfowler.com/bliki/AliasingBug.html?spm=ata.21736010.0.0.1bf49431yt4uP0
[3]. https://zhuanlan.zhihu.com/p/94568794?spm=ata.21736010.0.0.1bf49431yt4uP0
[4]. http://openjdk.java.net/jeps/169?spm=ata.21736010.0.0.1bf49431yt4uP0[5].
[5].https://blogs.oracle.com/jrose/value-types-in-the-vm?spm=ata.21736010.0.0.1bf49431yt4uP0
[6].https://bugs.openjdk.java.net/browse/JDK-8251554?spm=ata.21736010.0.0.1bf49431yt4uP0
[7].https://bugs.openjdk.java.net/browse/JDK-8259731?spm=ata.21736010.0.0.1bf49431yt4uP0
[8].https://openjdk.java.net/jeps/1?spm=ata.21736010.0.0.1bf49431yt4uP0
[9].https://docs.microsoft.com/zh-cn/dotnet/csharp/language-reference/builtin-types/value-types?spm=ata.21736010.0.0.1bf49431yt4uP0
[10].https://martinfowler.com/bliki/ValueObject.html?spm=ata.21736010.0.0.1bf49431yt4uP0
[11].https://mapstruct.org/?spm=ata.21736010.0.0.1bf49431yt4uP0

招聘职位
职级:P6~P8
岗位:Java研发
Base:杭州/北京
联系人:内转或推荐,请联系咱们(摩菲)
简历投递:chuanming.hucm@alibaba-inc.com
团队介绍
用户增加一直是互联网公司最核心的诉求,也是最能影响公司财报的关键指标。
在对用户争夺进入白热化的时期,淘系用户增加团队正承担着捍卫电商主板块增加以及赋能集团创新板块增加的重要使命,咱们将在最贴近用户的前线战场,用持续的技术创新来驱动阿里电商巨擎的稳步前行。
用户增加技术团队是一支年轻开放的团队,倡导“增加黑客”极客氛围,在这里你将收获超大规模高并发的架构能力,洞悉用户增加最前沿的实践方法,在数字化时代具有最核心的竞争力。



做者|少琛
编辑|橙子君
出品|阿里巴巴新零售淘系技术