聊聊 clean code

时间 2019-11-17

标签聊聊 clean code 繁體版

原文原文链接

本文转自美团点评技术学院，未经做者许可，不容许私自转载。
美团云知乎机构帐号每日分享云计算产品，技术内容。欢迎关注！
加入美团云技术交流群（QQ群：469243579），每日分享更多精彩技术文章。

clean code，顾名思义就是整洁的代码，或者说清晰、漂亮的代码，相信大多数工程师都但愿本身能写出这样的代码。git

也许这是个千人千面的话题，每一个工程师都有本身的理解。好比我，从一个每天被骂代码写得烂的人，逐渐学习成长，到如今也能写的出“人模人样”的代码来了。这期间算是积累了一点经验心得，想和你们分享，抛砖引玉。数据库

本文主要针对面向对象编程的clean code来阐述，面向过程代码的思路会比较不一样，不在本文的讨论范畴。编程

代码整洁的大前提

代码大部分时候是用来维护的，而不是用来实现功能的

这个原则适用于大部分的工程。咱们的代码，一方面是编译好让机器执行，完成功能需求；另外一方面，是写给身边的队友和本身看的，须要长期维护，并且大部分项目都不是朝生夕死的短命鬼。

大部分状况下，若是不能写出清晰好看的代码，可能本身一时爽快，后续维护付出的代价和成本将远高于你的想象。

对清晰好看代码的追求精神，比全部的技巧都要重要。

优秀的代码大部分是能够自描述的，好于文档和注释

当你翻看不少开源代码时，会发现注释甚至比咱们本身写的项目都少，可是却能看的很舒服。当读完源码时，不少功能设计就都清晰明了了。经过仔细斟酌的方法命名、清晰的流程控制，代码自己就能够拿出来看成文档使用，并且它永远不会过时。

相反，注释不能让写的烂的代码变的更好。若是别人只能依靠注释读懂你的代码的时候，你必定要反思代码出现了什么问题（固然，这里不是说你们不要写注释了）。

说下比较适合写注释的两种场景：

public interface，向别人明确发布你功能的语义，输入输出，且不须要关注实现。
功能容易有歧义的点，或者涉及比较深层专业知识的时候。好比，若是你写一个客户端，各类config参数的含义等。

设计模式只是手段，代码清晰才是目的

以前见过一些所谓“高手”的代码都比较抽象，各类工厂、各类继承。想找到一个实现老是要山路十八弯，一个工程里大部分的类是抽象类或者接口，找不到一两句实现的代码，整个读起代码来很不畅。我跟他聊起来的时候，他的主要立场是：保留合适的扩展点，克服掉全部的硬编码。

其实在我看来，也许他的代码被“过分设计”了。首先必需要认可的是，在同一个公司工做的同事，水平是良莠不齐的。不管你用了如何高大上的设计，若是大多数人都不能理解你的代码或者读起来很费劲的话，其实这是一个失败的设计。

当你的系统内大部分抽象只有一个实现的时候，要好好思考一下，是否是设计有点过分了，清晰永远是第一准则。

代码整洁的常见手段

记住原则后，咱们开始进入实践环节，先来看下有哪些促成clean code的常见手段。

code review

不少大公司会用git的pull request机制来作code review。咱们重点应该review什么？是代码的格式、业务逻辑仍是代码风格？我想说的是，凡是能经过机器检查出来的事情，无需经过人。好比换行、注释、方法长度、代码重复等。除了基本功能需求的逻辑合理没有bug外，咱们更应该关注代码的设计与风格。好比，一段功能是否是应该属于一个类、是否是有不少类似的功能能够抽取出来复用、代码太过冗长难懂等等。

我我的很是推崇集体code review，由于不少时候，组里相对高级的工程师可以一眼发现代码存在较大设计缺陷，提出改进意见或者重构方式。咱们能够在整个小组内造成一个好的文化传承和风格统一，而且很大程度上培养了你们对clean code的热情。

勤于重构

好的代码，通常都不是一撮而就的。即便一开始设计的代码很是优秀，随着业务的快速迭代，也可能被改的面目全非。

为了不重构带来的负面影响（delay需求或者带来bug），咱们须要作好如下的功课：

① 掌握一些常见的“无痛”重构技巧，这在下文会有具体讲解。

② 小步快跑，不要企图一口吃成个胖子。改一点，测试一点，一方面减小代码merge的痛苦，另外一方面减小上线的风险。

③ 创建自动化测试机制，要作到即便代码改坏了，也能保证系统最小核心功能的可用，而且保证本身修改的部分被测试覆盖到。

④ 熟练掌握IDE的自动重构功能。这些会很大程度上减小咱们的体力劳动，避免犯错。

静态检查

如今市面上有不少代码静态检查的工具，也是发现bug和风格很差的比较容易的方式。能够与发布系统作集成，强制把主要问题修复掉才能够上线。目前美团点评技术团队内部的研发流程中已经广泛接入了Sonar质量管理平台。

多读开源代码和身边优秀同窗的代码

感谢开源社区，为咱们提供了这么好的学习机会。不管是JDK的源码，仍是经典的Netty、Spring、Jetty，仍是一些小工具如Guava等，都是clean code的典范。多多学习，多多反思和总结，必有收益。

代码整洁的常见技巧

前面的内容都属于热身，让你们有个总体宏观的认识。下面终于进入干货环节了，我会分几个角度讲解编写整洁代码的常见技巧和误区。

通用技巧
单一职责

这是整洁代码的最重要也是最基本的原则了。简单来说，大到一个module、一个package，小到一个class、一个method乃至一个属性，都应该承载一个明确的职责。要定义的东西，若是不能用一句话描述清楚职责，就把它拆掉。

咱们平时写代码时，最容易犯的错误是：一个方法干了好几件事或者一个类承载了许多功能。

先来聊聊方法的问题。我的很是主张把方法拆细，这是复用的基础。若是方法干了两件事情，颇有可能其中一个功能的其余业务有差异就很差重用了。另外语义也是不明确的。常常看到一个get()方法里面居然修改了数据，这让使用你方法的人情何以堪？若是不点进去看看实现，可能就让程序陷入bug，让测试陷入麻烦。
再来聊聊类的问题。咱们常常会看到“又臭又长”的service/biz层的代码，里面有几十个方法，干什么的都有：既有增删改查，又有业务逻辑的聚合。每次找到一个方法都费劲。不属于一个领域或者一个层次的功能，就不要放到一块儿。
咱们team在code review中，最常被批评的问题，就是一个方法应该归属于哪一个类。

优先定义总体框架

我写代码的时候，比较喜欢先去定义总体的框架，就是写不少空实现，来把总体的业务流程穿起来。良好的方法签名，用入参和出参来控制流程。这样可以避免陷入业务细节没法自拔。在脑海中先定义清楚流程的几个阶段，并为每一个阶段找到合适的方法／类归属。

这样作的好处是，阅读你代码的人，不管读到什么深度，均可以清晰地了解每一层的职能，若是不care下一层的实现，彻底能够跳过不看，而且方法的粒度也会恰到好处。

简而言之，我比较推崇写代码的时候“广度优先”而不是“深度优先”，这和我读代码的方式是一致的。固然，这件事情跟我的的思惟习惯有必定的关系，可能对抽象思惟能力要求会更高一些。若是开始写代码的时候这些不够清晰，起码要经过不断地重构，使代码达到这样的成色。

清晰的命名

老生常谈的话题，这里不展开讲了，可是必需要mark一下。有的时候，我思考一个方法命名的时间，比写一段代码的时间还长。缘由仍是那个逻辑：每当你写出一个相似于"temp"、"a"、"b"这样变量的时候，后面每个维护代码的人，都须要用几倍的精力才能理顺。

而且这也是代码自描述最重要的基础。

避免过长参数

若是一个方法的参数长度超过4个，就须要警戒了。一方面，没有人可以记得清楚这些函数的语义；另外一方面，代码的可读性会不好；最后，若是参数很是多，意味着必定有不少参数，在不少场景下，是没有用的，咱们只能构造默认值的方式来传递。

解决这个问题的方法很简单，通常状况下咱们会构造paramObject。用一个struct或者一个class来承载数据，通常这种对象是value object，不可变对象。这样，能极大程度提升代码的可复用性和可读性。在必要的时候，提供合适的build方法，来简化上层代码的开发成本。

避免过长方法和类

一个类或者方法过长的时候，读者老是很崩溃的。简单地把方法、类和职责拆细，每每会有立竿见影的成效。以类为例，拆分的维度有不少，常见的是横向／纵向。例如，若是一个service，处理的是跟一个库表对象相关的全部逻辑，横向拆分就是根据业务，把创建／更新／修改／通知等逻辑拆到不一样的类里去；而纵向拆分，指的是

把数据库操做/MQ操做/Cache操做/对象校验等，拆到不一样的对象里去，让主流程尽可能简单可控，让同一个类，表达尽可能同一个维度的东西。

让相同长度的代码段表示相同粒度的逻辑

这里想表达的是，尽可能多地去抽取private方法，让代码具备自描述的能力。举个简单的例子

public void doSomeThing(Map params1,Map params2){
   Do1 do1 = getDo1(params1);
   Do2 do2 = new Do2();
   do2.setA(params2.get("a"));
   do2.setB(params2.get("b"));
   do2.setC(params2.get("c"));
   mergeDO(do1,do2);
   }
   private void getDo1(Map params1);
   private void mergeDo(do1,do2){...};复制代码

相似这种代码，在业务代码中随处可见。获取do1是一个方法，merge是一个方法，但获取do2的代码却在主流程里写了。这种代码，流程越长，读起来越累。不少人读代码的逻辑，是“广度优先”的。先读懂主流程，再去看细节。相似这种代码，若是可以把构造do2的代码，提取一个private 方法，就会舒服不少。

面向对象设计技巧

贫血与领域驱动

不得不认可，Spring已经成为企业级Java开发的事实标准。而大部分公司采用的三层/四层贫血模型，已经让咱们的编码习惯，变成了面向DAO而不是面向对象。

缺乏了必要的模型抽象和设计环节，使得代码冗长，复用程度比较差。每次撸代码的时候，从mapper撸起，好像已经成为不成文的规范。

好处是上手简单，学习成本低。可是每次都不能重用，而后面对两三千行的类看着眼花的时候，个人心是很痛的。关于领域驱动的设计模式，本文不会展开去讲。回归面向对象，仍是跟你们share一些比较好的code技巧，可以在一个通用的框架下，尽可能好的写出漂亮可重用的code。

我的认为，一个好的系统，必定离不开一套好的模型定义。梳理清楚系统中的核心模型，清楚的定义每一个方法的类归属，不管对于代码的可读性、可交流性，仍是和产品的沟通，都是有莫大好处的。

为每一个方法找到合适的类归属，数据和行为尽可能要在一块儿

若是一个类的全部方法，都是在操做另外一个类的对象。这时候就要仔细想想类的设计是否合理了。理论上讲，面向对象的设计，主张数据和行为在一块儿。这样，对象之间的结构才是清晰的，也能减小不少没必要要的参数传递。

不过这里面有一个要讨论的方法：service对象。若是操做一个对象数据的全部方法都创建在对象内部，可能使对象承载了不少并不属于它自己职能的方法。

例如，我定义一个类，叫作person，。这个类有不少行为，好比：吃饭、睡觉、上厕所、生孩子；也有不少字段，好比：姓名、年龄、性格。

很明显，字段从更大程度上来说，是定义和描述我这我的的，但不少行为和个人字段并不相关。上厕所的时候是不会关心我是几岁的。若是把全部关于人的行为所有在person内部承载，这个类必定会膨胀的不行。

这时候就体现了service方法的价值，若是一个行为，没法明确属于哪一个领域对象，牵强地融入领域对象里，会显得很不天然。这时候，无状态的service能够发挥出它的做用。但必定要把握好这个度，回归本质，咱们要把属于每一个模型的行为合理的去划定归属。

警戒static

static方法，本质上来说是面向过程的，没法清晰地反馈对象之间的关系。虽然有一些代码实例（本身实现单例或者Spring托管等）的无状态方法能够用static来表示，但这种抽象是浅层次的。说白了，若是咱们全部调用static的地方，都写上import static，那么全部的功能就由类本身在承载了。

让我画一个类图？尴尬了……画不出来。

而单例的膨胀，很大程度上也是贫血模型带来的反作用。若是对象自己有血有肉，就不须要这么多无状态方法。

static真正适用的场景：工具方法，而不是业务方法。

巧用method object

method object是大型重构的经常使用技巧。当一段逻辑特别复杂的代码，充斥着各类参数传递和是非因果判断的时候，我首先想到的重构手段是提取method object。所谓method object，是一个有数据有行为的对象。依赖的数据会成为这个对象的变量，全部的行为会成为这个对象的内部方法。利用成员变量代替参数传递，会让代码简洁清爽不少。而且，把一段过程式的代码转换成对象代码，为不少面向对象编程才可使用的继承／封装／多态等提供了基础。

举个例子，上文引用的代码若是用method object表示大概会变成这样

class DoMerger{
    map params1;
    map params2;
    Do1 do1;
    Do2 do2;
    public DoMerger(Map params1,Map params2){
       this.params1 = params1;
       this.params2 = parmas2;
    }
    public void invoke(){
        do1 = getDo1();
        do2 = getDo2();
       mergeDO(do1,do2);
    }
    private Do1 getDo1();
     private Do2 getDo2();
     private void mergeDo(){
        print(do1+do2);
     }
 }复制代码

面向接口编程

面向接口编程是不少年来你们造成的共识和最佳实践。最先的理论是便于实现的替换，但如今更显而易见的好处是避免public方法的膨胀。一个对外publish的接口，必定有明确的职责。要判断每个public方法是否应该属于同一个interface，是很容易的。

整个代码基于接口去组织，会很天然地变得很是清晰易读。关注实现的人才去看实现，不是嘛？

正确使用继承和组合

这也是个在业界被讨论过好久的问题，也有不少论调。最新的观点是组合的使用通常状况下比继承更为灵活，尤为是单继承的体系里，因此倾向于使用组合

，不然会让子类承载不少不属于本身的职能。

我的对此观点持保留意见，在我经历过的代码中，有一个小规律，我分析一下。

protected abstract 这种是最值得使用继承的，父类保留扩展点，子类扩展，没什么好说的。

protected final 这种方法，子类是只能使用不能修改实现的。通常有两种状况：

① 抽象出主流程不能被修改的，然而通常状况下，public final更适合这个职能。若是只是流程的一部分，须要思考这个流程的类归属，大部分变成public组合到其余类里是更合适的。

② 父类是抽象类没法直接对外提供服务，又不但愿子类修改它的行为，这种大多数状况下属于工具方法，比较适合用另外一个领域对象来承载并用组合的方式来使用。

protected 这种是有争议的，是父类有默认实现但子类能够扩展的。凡有扩展可能的，使用继承更理想一些。不然，定义成final并考虑成组合。

综上所述，我的认为继承更多的是为扩展提供便利，为复用而存在的方法最好使用组合的方式。固然，更为大的原则是明确每一个方法的领域划分。

代码复用技巧
模板方法

这是我用得最多的设计模式了。每当有两个行为相似但又不彻底相同的代码段时，我老是会想到模板方法。提取公共流程和可复用的方法到父类，保留不一样的地方做为abstract方法，由不一样的子类去实现。

并在合适的时机，pull method up（复用）或者 pull method down（特殊逻辑）。

最后，把不属于流程的、但可复用的方法，判断是否是属于基类的领域职责，再使用继承或者组合的方法，为这些方法找到合适的安家之处。

extract method

不少复用的级别没有这么大，也许只是几行相同的逻辑被copy了好几回，何不尝试提取方法（private）。又能明确方法行为，又能作到代码复用，何乐不为？

责任链

常常看到这样的代码，一连串相似的行为，只是数据或者行为不同。如一堆校验器，若是成功怎么样、失败怎么样；或者一堆对象构建器，各去构造一部分数据。碰到这种场景，我老是喜欢定义一个通用接口，入参是完整的要校验／构造的参数，

出参是成功/失败的标示或者是void。而后有不少实现器分别实现这个接口，再用一个集合把这堆行为串起来。最后，遍历这个集合，串行或者并行的执行每一部分的逻辑。

这样作的好处是：

① 不少通用的代码能够在责任链原子对象的基类里实现；

② 代码清晰，开闭原则，每当有新的行为产生的时候，只须要定义行的实现类并添加到集合里便可；

③ 为并行提供了基础。

为集合显式定义它的行为

集合是个有意思的东西，本质上它是个容器，但因为泛型的存在，它变成了能够承载全部对象的容器。不少非集合的类，咱们能够定义清楚他们的边界和行为划分，可是装进集合里，它们却都变成了一个样子。不停地有代码，各类循环集合，作一些类似的操做。

其实不少时候，能够把对集合的操做显示地封装起来，让它变得更有血有肉。

例如一个Map，它可能表示一个配制、一个缓存等等。若是全部的操做都是直接操做Map，那么它的行为就没有任何语义。第一，读起来就必需要深刻细节；第二，若是想从获取配置读取缓存的地方加个通用的逻辑，例如打个log什么的，你能够想象是多么的崩溃。

我的提倡的作法是，对于有明确语义的集合的一些操做，尤为是全局的集合或者被常用的集合，作一些封装和抽象，如把Map封装成一个Cache类或者一个config类，再提供GetFromCache这样的方法。

总结

本文从clean code的几个大前提出发，而后提出了实践clean code的一些手段，重点放在促成clean code的一些经常使用编码和重构技巧。

固然，这些只表明笔者本人的一点点感悟。好的代码，最最须要的，仍是你们不断追求卓越的精神。欢迎你们一块儿探索交流这个领域，为clean code提供更多好的思路与方法。

做者简介

王烨，如今是美团点评旅游后台研发组的工程师，以前曾经在百度、去哪儿和优酷工做过，专一Java后台开发。对于网络编程和并发编程具备浓厚的兴趣，曾经作过一些基础组件，也翻过一些源码，属于比较典型的宅男技术控。期待可以与更多知己，在coding的路上并肩前行~

1. 聊聊clean code
2. 聊聊jvm的Code Cache
3. 聊Code review(下)
4. 聊聊claudb的DatabaseCleaner
5. clean code
6. 聊聊flink的BoltWrapper
7. 聊聊HystrixCommandExecutionHook
8. 聊聊flink的EventTime
9. 聊聊flink的PrintSinkFunction
10. 聊聊flink的TableFunction
更多相关文章...
• Maven 插件 - Maven教程
• Maven 构建生命周期 - Maven教程
• Java Agent入门实战（一）-Instrumentation介绍与使用
• 算法总结-深度优先算法