重构——改善既有代码的设计

2015-06-08 本文已影响4639人 0d339158f1a6

《重构——改善既有代码的设计》
《Refactoring——Improve the Design of Existing Code》
作者： 马丁富勒 （Martin Fowler）

一、什么是重构？

所谓重构是这样一个过程：在不改变代码外在行为的前提下，对代码作出修改，以改进程序的内部结构。本质上说，重构就是在代码写好之后改进它的设计。

重构（名词）：对软件内部结构的一种调整，目的是在不改变软件可观察行为的前提下，提高其可理解性，降低其修改成本。
重构（动词）：使用一系列重构手法，在不改变软件可观察行为的前提下，调整其结构。

重构的目的是使软件更容易被理解和修改。重构不会改变软件可观察的行为——重构之后软件功能一如既往。

重构技术就是以微小的步伐修改程序，如果你犯下错误，很容易便可以发现它。

二、为何重构？

（1） 重构改进软件设计。如果没有重构，程序的设计会逐渐腐败变质。重构很像是在整理代码，你所做的就是让所有东西回到应出的位置上。经常性的重构可以帮助维持自己该有的形态。

（2）重构使软件更容易理解。重构可以帮助我们让代码更易读。

（3）重构帮助找到bug。对代码进行重构，可以帮助我们深入理解代码，对代码理解的越深，就越能帮我们找到bug。重构能够帮我们更有效地写出强健的代码。

（4）重构提高变成速度。重构可以帮助我们更快速地开发软件，因为它阻止系统腐败变质，它甚至还可以提高设计质量。

三、何时重构？

重构不是一件应该特别拨出时间做的事情，重构应该随时随地进行。不应该为重构而重构，之所以重构，是因为我们想做别的什么事，而重构可以帮助我们把那些事做好。

三次法则：事不过三，三则重构。

（1）添加功能时重构。
（2）修补错误时重构。
（3）复审代码时重构。

四、何时不该重构？

代码根本无法工作或者太糟糕，重构还不如重写来的简单。

在项目的最后期限，应该避免重构。

五、代码的坏味道

重复代码(Duplicated Code)
过长函数(Long Method)
过大的类(Large Class)
过长参数列(Long Parameter List)
发散式变化(Divergent Change)：一个类受多种变化的影响
霰弹式修改(Shotgun Surgery)：一种变化引发多个类相应修改
依恋情结(Feature Envy)：函数对某个类的兴趣高过自己所处类的兴趣
数据泥团(Data Clumps)：相同的若干项数据出现在不同地方，这些绑在一起出现的数据应该有属于它们自己的对象
基本类型偏执(Private Obsession)：很多人不愿意在小任务上运用小对象
switch惊悚现身(Switch Statements)：switch语句会在很多地方重复出现，一改则需全改
平行继承体系(Parallel Inheritance Hierarchies)：当你为某一个类增加子类时，也必须为另一个类相应增加一个类
冗赘类(Lazy Class)：如果一个类不值得存在，那就让它消失
夸夸其谈的未来星(Speculative Generality)：预留的无用的抽象类，无用的抽象参数
令人迷惑的暂时字段(Temporary Field)：类中某个字段只为某些特殊情况而设置
过度耦合的消息链(Message Chains)：用户向一个对象请求另一个对象，然后再向后者请求另一个对象......
中间人(Middle Man)：无用的委托，过多的中间层
狎昵关系(Inappropriate Intimacy)：两个类过于亲密，一个类过于关注另一个类的成员
异曲同工的类(Alternative Classes with Different Interfaces)：不同名字的类或函数，作者相同的事
不完美的库类(Incomplete Library Class)：类库设计不可能完美
纯数据类(Data Class)：一个类拥有一些字段以及用于访问这些字段的函数，除此之外一无长物
被拒绝的遗赠(Refused Bequest)：子类不想继承超类所有的函数和数据，只想挑几样来玩
过多的注释(Comments)

六、构筑测试体系

重构的首要前提是拥有一个可靠的测试环境。
只要写好一点功能，就立即添加测试，并确保所有测试都完全自动化，让它们检查自己的测试结果。一套测试就是一个强大的bug侦测器，能够大大缩减查找bug所需要的时间。
撰写测试代码的最有用时机是在开始编程之前。当你需要添加特性的时候，先写相应测试代码。编写测试代码其实就是在问自己：添加这个功能需要做些什么。编写测试代码还能使你把注意力集中于接口而非实现。预先写好的测试代码也为你的工作安上一个明确的结束标志：一旦测试代码正常运行，工作就可以结束了。
多运用单元测试。测试你最担心出错的地方，考虑可能出错的边界条件。不要因为测试无法捕捉所有bug就不写测试，因为测试的确可以捕捉到大多数bug。“花合理时间抓出大多数bug”要好过“穷尽一生抓出所有bug”。

七、重新组织函数

提炼函数（Extract Method）。你有一段代码可以被组织在一起并独立出来。将这段代码放进一个独立函数中，并将函数名称解释该函数的用途。
内联函数（Inline Method）。一个函数的本体与名称同样清楚易懂。在函数调用点插入函数本体，然后移除该函数。
内联临时变量（Inline Temp）。你有一个临时变量，只被一个简单表达式赋值一次，而它妨碍了其他重构手法。将所有对该变量的引用动作，替换为对它赋值的那个表达式自身。
以查询取代临时变量（Replace Temp with Query）。你的程序以一个临时变量保存某一表达式的运算结果。将这个表达式提炼到一个独立函数中。将这个临时变量的所有引用点替换为对新函数的调用。此后，新函数就可被其他函数使用。
引入解释性变量（Introduce Explaining Variable）。你有一个复杂的表达式。将该复杂表达式（或其中一部分）的结果放进一个临时变量，以此变量名称来解释表达式用途。
分解临时变量（Split Temporary Variable）。你的程序有某个临时变量被赋值过一次，它既不是循环变量，也不被用于收集计算结果。针对每次赋值，创造一个独立、对应的临时变量。
移除对参数的赋值（Remove Assignments Parameters）。代码对一个参数进行赋值。以一个临时变量取代参数的位置。
以函数对象取代函数（Replace Method with Method Object）。你有一个大型函数，其中对局部变量的使用使你无法采用Extract Method。将这个函数放进一个单独对象中，如此一来局部变量就成了对象内的字段。然后你可以在同一个对象中将这个大型函数分解为多个小型函数。
替换算法（Substitute Algorithm）。你想要把某个算法替换为另一个更清晰的算法。将函数本体替换为另一个算法。

八、在对象之间搬移特性

搬移函数（Move Method）。你的程序中，有个函数与其所驻之外的另一个类进行更多交流：调用后者，或被后者调用。在该函数最常引用的类中建立一个有着类似行为的新函数。将旧函数变成一个单纯的委托函数，或是将旧函数完全移除。
搬移字段（Move Field）。你的程序中，某个字段被其所驻类之外的另一个类更多地用到。在目标类新建一个字段，修改源字段的所有用户，令它们改用新字段。
提炼类（Extract Class）。某个类做了应该有两个类做的事。建立一个新类，将相关的字段和函数从旧类搬移到新类。
将类内联化（Inline Class）。某个类没有做太多事情。将这个类的所有特性搬移到另一个类中，然后移除原类。
隐藏“委托关系”（Hide Delegate）。客户通过一个委托来调用另一个对象。在服务类上建立客户所需的所有函数，用以隐藏委托关系。
移除中间人（Remove Middle Man）。某个类做了过多的简单委托动作。让客户直接调用受托类。
引入外加函数（Introduce Foreign Method）。你需要为提供服务的类增加一个函数，但你无法修改这个类。在客户类中建立一个函数，并以第一参数形式传入一个服务类实例。
引入本地扩展（Introduce Local Extension）。你需要为服务类提供一些额外函数，但你无法修改这个类。建立一个新类，使它包含这些额外函数。让这个扩展品成为源类的子类或包装类。

九、重新组织数据

自封装字段（Self Encapsulate Field）。你直接访问一个字段，但与字段之间的耦合关系逐渐变得笨拙。为这个字段建立取值/设值函数，并且只以这些函数来访问字段。
以对象取代数据值（Replace Data Value with Object）。你有一个数据项，需要与其他数据和行为一起使用才有意义。将数据项变成对象。
将值对象改为引用对象（Change Value to Reference）。你从一个类衍生出许多彼此相等的实例，希望将它们替换为同一个对象。将这个值对象变成引用对象。
将引用对象改为值对象（Change Reference to Value）。你有一个引用对象，很小且不可变，而且不易管理。将它变成一个值对象。
以对象取代数据（Replace Array with Object）。你有一个数组，其中的元素各自代表不同的东西。以对象替换数组，对于数组中的每个元素，以一个字段来表示。
复制“被监视数据”（Duplicate Observed Data）。你有一些领域数据置身GUI控件中，而领域函数需要访问这些数据。将该数据复制到一个领域对象中。建立一个Observe模式，用以同步领域对象和GUI对象内的重复数据。
将单向关联改为双向关联（Change Unidirectional Association to Bidirectional）。两个类都需要使用对方特性，但其间只有一条单向链接。添加一个反向指针，并使修改函数能够同时更新两条链接。
将双向关联改为单向关联（Change Bidirectional Association to Unidirectional）。两个类之间有双向关联，但其中一个类如今不再需要另一个类的特性。去除不必要的关联。
以字面常量取代魔法数（Replace Magic Number with Symbolic Constant）。你有一个字面数值，带有特别含义。创造一个常量，根据其意义为它命名，并将上述的字面数值替换为这个常量。
封装字段（Encapsulate Field）。你的类中存在一个public字段。将它声明为private，并提供相应的访问函数。
封装集合（Encapsulate Collection）。有个函数返回一个集合。让这个函数返回该集合的一个只读副本，并在这个类中提供添加/移除集合元素的函数。
以数据类取代记录（Replace Record with Data Class）。你需要面对传统编程环境中的记录结构。为该记录创建一个“哑”数据对象。
以类取代类型码（Replace Type Code with Class）。类之中有一个数值类行码，但它并不影响类的行为。以一个新的类替换该数值类型码。
以子类取代类型码（Replace Type Code with Subclass）。你又一个不可变的类型码，它会影响类的行为。以子类取代这个类型码。
以State/Strategy取代类型码（Replace Type Code with State/Strategy）。你有一个类型码，它会影响类的行为，但你无法通过继承手法消除它。以状态对象取代类型码。
以字段取代子类（Replace Subclass with Fields）。你的各个子类的唯一差别只在“返回常量数据”的函数身上。修改这些函数，使他么返回超类中的某个（新增）字段，然后销毁子类。

十、简化条件表达式

分解条件表达式（Decompose Conditional）。你有一个复杂的条件（if-then-else）语句。从if、then、else三分段落中分别提炼出独立函数。
合并条件表达式（Consolidate Conditional Expression）。你有一系列条件测试，都得到相同结果。将这些测试合并为一个条件表达式，并将这个条件表达式提炼成为一个独立函数。
合并重复的条件片段（Consolidate Duplicate Conditional Fragments）。在条件表达式的每个分支上有着相同的一段代码。将这段重复的代码搬移到条件表达式之外。
移除控制标记（Remove Control Flag）。在一系列布尔表达式中，某个变量带有“控制标记”的作用。以break语句或return语句取代控制标记。
以卫语句取代嵌套条件表达式（Replace nested Conditional with Guard Clauses）。函数中的条件逻辑使人难以看清正常的执行路径。使用卫语句表现所有的特殊情况。
以多态取代条件表达式（Replace Conditional with Polymorphism）。你手上有个条件表达式，它根据对象类型的不同选择不同的行为。将这个条件表达式的每个分支放进一个子类内的覆写函数中，然后将原始函数声明为抽象函数。
引入Null对象（Introduce Null Object）。你需要再三检查某对象是否为null。将null值替换为null对象。
引入断言（Introduce Assertion）。某一段代码需要对程序状态做出某种假设。以断言明确表现这种假设。

十一、简化函数调用

函数改名（Rename Method）。函数的名称未能揭示函数的用途。修改函数的名称。
添加参数（Add Parameter）。某个函数需要从调用端得到更多信息。为此函数添加一个对象参数，让该对象带进函数所需信息。
移除参数（Remove Parameter）。函数本体不再需要某个参数。将该参数去除。
将查询函数和修改函数分离（Separate Query from Modifier）。某个函数既返回对象状态值，又修改对象状态。建立两个不同的函数，其中一个负责查询，另一个负责修改。
令函数携带参数（Parameterize Method）。若干函数做了类似的工作，但在函数本体中却包含了不同的值。建立单一函数，以参数表达那些不同的值。
以明确函数取代参数（Replace Parameter with Explicit Methods）。你有一个函数，其中完全取决于参数值而采取不同行为。针对该参数的每一个可能值，建立一个独立函数。
保持对象完整（Preserve Whole Object）。你从某个对象中取出若干值，将它们作为某一次函数调用时的参数。改为传递整个对象。
以函数取代参数（Replace Parameter with Methods）。对象调用某个函数，并将所得结果作为参数，传递给另一个函数。而接受该参数的函数本身也能够调用前一个函数。让参数接受者去除该项参数，并直接调用前一个函数。
引入参数对象（Introduce Parameter Object）。某些参数总是很自然地同时出现。以一个对象取代这些参数。
移除设值函数（Remove Setting Method）。类中的某个字段应该在对象创建时被设值，然后就不再改变。去掉该字段的所有设值函数。
隐藏函数（Hide Method）。有一个函数，从来没有被其他任何类用到。将这个函数修改为private。
以工厂函数取代构造函数（Replace Constructor with Factory Method）。你希望在创建对象时不仅仅是做简单的构建动作。将构建函数替换为工厂函数。
封装向下转型（Encapsulate Downcast）。某个函数返回的对象，需要由函数调用者执行向下转型。将向下转型动作移到函数中。
以异常取代错误码（Replace Error Code with Exception）。某个函数返回一个特定的代码，用以表示某种错误情况。改用异常。
以测试取代异常（Replace Exception with Test）。面对一个调用者可以预先检查的条件，你抛出了一个异常。修改调用者，使它在调用函数之前先做检查。

十二、处理概括关系

字段上移（Pull Up Field）。两个子类拥有相同的字段。将该字段移至超类。
函数上移（Pull Up Method）。有些函数，在各个子类中产生完全相同的结果。将该函数移至超类。
构造函数本体上移（Pull Up Constructor Body）。你在各个子类中拥有一些构造函数，他们的本体几乎完全一致。在超类中新建一个构造函数，并在子类构造函数中调用它。
函数下移（Push Down Method）。超类中的某个函数只与部分（而非全部）子类有关。将这个函数移到相关的那些子类去。
字段下移（Push Down Field）。超类中的某个字段只被部分（而非全部）子类用到。将这个字段移到需要它的那些子类去。
提炼子类（Extract Subclass）。类中的某些特性只被某些（而非全部）实例用到。新建一个子类，将上面所说的那一部分特性移到子类中。
提炼超类（Extract Superclass）。两个类有相似特性。为这两个类建立一个超类，将相同特性移至超类。
提炼接口（Extract Interface）。若干客户使用类接口中的同一子集，或者两个类的接口有部分相同。将相同的子集提炼到一个独立接口中。
折叠继承体系（Collapse Hierarchy）。超类和子类之间无太大差别。将它们合为一体。
塑造模板函数（Form TemPlate Method）。你有一些子类，其中相应的某些函数以相同顺序执行类似的操作，但各个操作的细节上所有不同。将这些操作分别放进独立函数中，并保持它们都有相同的签名，于是原函数也就变得相同了。然后将原函数上移至超类。
以委托取代继承（Replace Inheritance with Delegation）。某个子类只使用超类接口中的一部分，或是根本不需要继承而来的数据。在子类中新建一个字段用以保存超类；调整子类函数令它改而委托超类；然后去掉两者之间的继承关系。
以继承取代委托（Replace Delegation with Inheritance）。你在两个类之间使用委托关系，并经常为整个接口编写许多极简单的委托函数。让委托类来继承受托类。

十三、大型重构

梳理并分解继承体系（Tease Apart Inheritance）。某个继承体系同时承担两项责任。建立两个继承体系，并通过委托关系让其中一个可以调用另一个。
将过程化设计转化为对象设计（Convert Procedural Design to Objects）。你手上有一些传统过程化风格的代码。将数据记录变成对象，将大块的行为分成小块，并将行为移入相关对象之中。
将领域和表述/显示分离（Separate Domain from Presentation）。某些GUI类之中包含了领域逻辑。将领域逻辑分离出来，为它们建立独立的领域类。
提炼继承体系（Extract Hierarchy）。你有某各类做了太多工作，其中一部分工作是以大量条件表达式完成的。建立继承体系，以一个子类表示一种特殊情况。

十四、经典句子

Any fool can write code that a computer can understand. Good programmers write code that humans can understand. ——Martin Fowler
任何一个傻瓜都能写出计算机可以理解的代码。唯有写出人类容易理解的代码，才是优秀的代码。 ——Martin Fowler

I'm not a great programmer; I'm just a good programmer with great habits. ——Kent Beck
我不是个伟大的程序员，我只是一个有着一些优秀习惯的好程序员。 ——Kent Beck

Computer Science is the discipline that believes all problems can be solved with one more layer of indirection. ——Dennis DeBruler
计算机科学是这样一门科学：它相信所有问题都可以通过增加一个间接层来解决。——Dennis DeBruler

我的心得：

读者最好有一定的项目经验，或者了解过一些代码风格、设计模式、代码设计哲学等。
这是一本以java语言来讲重构的书，读者最好懂面向对象的基本知识，了解java、C++等面向对象的语言。
我不是作java开发的，但是我了解面向对象，了解C++，java。书中的一些理论和指导在其他设计语言上也有很大的帮助，并且我发现，在项目中我此刻就在运用着一些重构方法。书中那些过于结合面向对象的封装、继承、多态等知识的重构方法，可能就只适用于面向对象的语言吧。
**你值得一读。反复看，反复读。 **

我的胡说八道：

被你们发现了，其实我也是一个程序员，还是初级程序员。
这本书据说是java进阶必看，也是程序员必看的经典书籍。设计语言本身可能有区别，造成一些特性也会有区别，但是某些思想还是相通的。所有，非java、C++语言工作者，也一定要读一下。
据说stack overflow.com上发表的一篇《哪一本书最具影响力，是每个程序员都应该读的？》。《重构》这本书就排名前十，貌似是第六名。

重构——改变既有代码的设计.jpg

ps：我的笔记只记录了理论部分，书上每种重构方法都配有实例代码来讲解，大家可以细细研究。