程序员

软件编程基础规约

2018-06-13  本文已影响0人  随安居士

1. 概述

业界、指导编程的、经典书籍很多,如《重构》、《代码大全》、《设计模式》;更进一步的则有《敏捷软件开发》、《领域驱动设计》、《计算机程序的构造与解释》等等。这些书籍由浅入深的,有助于开发人员形成一整套的编程体系。

阅读这些书籍需要花费大量的精力,特别是《设计模式》、《领域驱动设计》、《计算机程序的构造与解释》。对于初学者来说有如天书,即便对于有经验的开发人员,想要看懂也并非易事。

另一方面,整个行业对软件开发人员的需求不断增加,人员能力参差不齐,软件质量无法保证。

本文尝试补齐开发人员能力和行业诉求之间的GAP。如果你是一名开发人员,尚未形成自己的编程体系。如果你正在开发产品功能需求,希望快速审视代码质量是否达到产品级标准。如果希望能更聚焦业务逻辑,而非基础编码的问题。那么,OK。

本文只此一篇,不是系列文章,也不会太长。本文将以最简短的方式,描述软件开发最基础、核心的六条编程规约。同时,文末还附赠了一条架构规约,当然这不是本文的重点。

2. 编程规约

2.1 规约1:代码分层设计

分层设计是编程的基础,首先要有一个合理的分层,才可能写出好的代码。那么什么才是好的分层设计?典型的代码分层又是什么样的呢?

好的分层设计应该包括如下几个特点:

典型的代码分层设计如下:


典型分层设计

2.2 规约2:面向接口编程

面向接口编程的核心诉求是信息隐藏,上层只关心和下层签订的“契约(接口)”。接口定义了需要提供哪些能力,而至于如何提供了这些能力上层不感知、也不关心。

这样做的带来的好处:解耦,下层可以选择任意方式实现“契约”。上层将全部精力关注到业务逻辑,如此方可开发出复杂、稳定的产品。

但落实到实现上,如果所有分层(最上层除外)都严格遵守接口、实现分离,不现实也不合适。每多一层抽象,就增加了代码的复杂度。这里涉及抽象粒度、时机:如何面向接口编程,同时减少不必要的接口抽象?

以我个人的经验来看,处理方式如下:

2.3 规约3:业务数据建模

任何一个业务功能都有其业务模型,即核心Entity抽象。大部分人在开发过程中,更关心的是逻辑、代码分支处理,而忽略了业务数据建模。最终,代码可以实现当前的功能诉求,但无法持续演进,新功能开发将导致大量既有代码变更。

因此我们强调,在开发之前,需要先对领域建模。本文讨论的是模块级的代码开发,而非系统级设计。对于一个功能模块来说,核心的数据模型(Entity)可能只有1-5个,一切的业务行为应围绕业务数据模型展开。

比如对于告警管理模块,核心的业务数据模型包括:当前告警Entity、历史告警Entity、事件Entity。告警管理业务围绕三个Enttiy展开,如告警清除,实际上只是从当前告警Entity到历史告警Entity的状态迁移。

典型的业务数据Entity具有如下几个特点:

除Entity外,还有一种业务数据模型称之为Value Object。Value Object没有唯一标识,通常附属在一个或者多个Entity之中。如Address附属在个人信息中时,属于Value Object。关于Entity、Value Object可参看《领域驱动设计》。

落到实现上,还有一个问题需要解决:代码是分层解耦、面向接口编程的,但Entity需要统一建模、跨层,二者互相矛盾。

这样说可能不够直接,举个例子:

class DemoApp
{
    private DemoServer demoServer = new DemoServer();

    public BusinessDto getBusinessData()
    {
        BusinessEntity entity = demoServer.getBusinessData();
        //类型转换
        return convertToDto(entity);
    }
}

class DemoServer
{
    private DemoDao demoDao = new DemoDao();
 
    public BusinessEntity getBusinessData()
    {
        //注:此处省略了repository,直接使用了dao层
        return demoDao.queryBusinessData();
    }
}

@Entity
@Table(name="tbl_sky")
class BusinessEntity
{
    @Id
     private int id;

    @Column(name="OPTLOCK")
    private string data;

    public int getId() { return id; }
    public void setId(int id) { this.id = id; }
    public string getData() { return data; }
    public void setData(string data) { this.data = data; }
}

各位有没有看出上面代码的问题?

  1. BusinessEntity是数据库实体类,Server层直接向上返回,破坏了信息隐藏原则。App层感知了底层依赖的Hibernate,App层被污染。
  2. Server层业务数据模型和数据库存储Entity抽象绑定,二者无法独立演进。底层抽象和存储介质相关,而业务数据模型只应和领域相关。举例来说,如果底层由MySql切换至MongoDB后,数据库Entity抽象变更,但Server层及之上的业务数据建模不应发生任何改变。

业界通常的做法是:一个业务数据按分层做多次建模,以保证分层解耦。如App层不会直接拿到Dao层的Entity,而是经过Server层转换后的另外一个Entity对象。这样就会导致同一个业务数据存在多个Entity对象,代码中充斥着大量的核心业务无关的转换逻辑。这增加了维护成本,提高了出错的可能性。我认为合理的做法应该是下面这样:

class DemoApp
{
    private DemoServer demoServer = new DemoServer();

    public BusinessDto getBusinessData()
    {
        BusinessEntity entity = demoServer.getBusinessData();
        //类型转换
        return convertToDto(entity);
    }
}

class DemoServer
{
    private DemoDao demoDao = new DemoDao();
 
    public IBusinessEntity getBusinessData()
    {
        //注:此处省略了repository,直接使用了dao层
        return demoDao.queryBusinessData();
    }
}

interface IBusinessEntity
{
    public int getId();
    public string getData();
}

@Entity
@Table(name="tbl_sky")
class BusinessEntity implements IBusinessEntity
{
    @Id
     private int id;

    @Column(name="OPTLOCK")
    private string data;

    public int getId() { return id; }
    public void setId(int id) { this.id = id; }
    public string getData() { return data; }
    public void setData(string data) { this.data = data; }
}

说明如下:

2.4 规约4:单一职责原则。

单一职责原则:就一个类而言,应该仅有一个引起它变化的原因;我们把职责定义为“变化的原因”。
--- 《敏捷软件开发》

单一职责原则就是我们常说的“分治”,组成软件系统的每个部分各司其职,协同完成复杂的系统任务。狭义来讲,单一职责原则用于指导分层、接口定义;按单一职责原则审视分层、接口定义的合理性。

而从更广泛的软件系统设计、实现角度来看,单一职责原则可做如下场景审视:

class LicenseConstants
{
    private String ROOT_PATH = "/root/lcs";
    private String ESN = "esn";
    ......
}

这是一段违反单一职责原则的经典案例。首先,类抽象本身就很有问题:LicenseConstants无法对应到现实世界、抽象概念中的任意实体,在业务建模阶段,你不可能构建这样一个模型对象。其次,整个License模块都可能是该类的修改点,如增加配置文件、资源项定义等各种场景。

再往上如模块、微服务、服务等也应遵循单一职责原则。其思考维度大同小异。

2.5 规约5:精简原则

一本书的完成,不在它不能加入任何内容的时候,而在不能再删去任何内容的时候。
----伏尔泰

生活中,我们希望在完成一件事时花费最少。其实,编码也是一样,好的程序员要对代码“吝啬”。完成同样的功能,我们希望自己编写的代码最少、最稳定、可读性最高。每一行代码经过精雕细琢后,将会深深的印在你的脑海里。

本节没有示例,只列出几个重要的检查项,开发人员在编码时懂得自省才是最重要的:

//找到type为grocery的所有交易
List<Transaction> groceryTrans = new Arraylist<>();
for(Transaction t: transactions){
    if(t.getType() == Transaction.GROCERY) {        
        groceryTrans.add(t);
    }
}

//按交易值降序排序
Collections.sort(groceryTrans, new Comparator(){
    public int compare(Transaction t1, Transaction t2) {
        return t2.getValue().compareTo(t1.getValue());
    }
});

//获取ID集合
List<Integer> transIds = new ArrayList<>();
for(Transaction t: groceryTrans){
    transIds.add(t.getId());
}

采用Java8的Lambda、Stream的实现如下:

List<Integer> transIds = transactions.
    parallelStream().
    filter(t -> t.getType() == Transaction.GROCERY).    //找到type为grocery的所有交易
    sorted(comparing(Transaction::getValue).reversed()).    //按交易值降序排序
    map(Transaction::getId).            //获取ID集合
    collect(toList());              //以List形式返回

2.6 规约6:生命周期最小化原则

不知道各位有没有这样的体验:在编程阶段,大脑中模拟程序运行,并验证结果是否符合预期,从而调整代码。在定位问题时也是一样:测试描述操作步骤和问题现象,在脑中构想程序运行经过的分支,推测可能出现问题的代码段。如果有过上述的经历,说明对于编程至少已经入门。反过来,对于一切问题定位都依赖日志、调试信息的开发人员,我只想说:换一个行业,希望还来得及。

继续刚才的话题,如果希望模拟结果正确,代码必须精简,同时系统运行状态可控。关于代码精简可参见上一规约,运行状态可控就是本节要讲的生命周期最小化。

系统运行状态管理,说的简单点就是变量生命周期管理。程序中每个变量代表了一种可变状态,后端代表的实体可能是内核锁资源、内存数据、文件、数据库、网络等等。程序在运行过程中,这些数据不断变化,共同组成了系统的运行状态。变量越多、生命周期越长,系统越复杂、越不容易稳定。

我们希望尽量控制变量的数量和生命周期,使系统具备“可追踪性”。变量的作用域越大,变量的“可追踪性”越弱。对于变量使用的优先级应该是:无变量 > 局部变量 > 成员变量 > 全局变量(静态变量)

上面的表述直接、简单,但没讲具体怎么做。下面列几个典型的、违反可追踪性的示例加以说明:

  1. 示例:将成员变量降至局部变量
    可降至局部变量的成员变量应局部如下特点:
    1.a) 成员变量本身不是对象的核心属性
    1.b) 成员变量只被一个对外(public)方法使用,其余方法不使用或仅private方法使用。

违规代码:

class   DemoClass
{
    private int xx;

    public void doSomething(int param)
    {
        //do ...
        xx = calcData(param);
        doAnotherThing();
    }

    private void doAnotherThing()
    {
        switch(xx)
        {
            case 0:
                //...
                break;
            case 1:
                //...
                break;
        }
    }
}

修改后:

class   DemoClass
{
    public void doSomething(int param)
    {
        //do ...
        int xx = calcData(param);
        doAnotherThing(xx);
    }

    private void doAnotherThing(int xx)
    {
        switch(xx)
        {
            case 0:
                //...
                break;
            case 1:
                //...
                break;
        }
    }
}
  1. 示例:成员变量生命周期放大

我们说一个变量是成员变量时,强调的一定是它的“成员”属性,也就是说这个变量是类对象的一员,那么它就不应该脱离类对象的管控。一旦将该成员变量做为引用对象对外暴露后,该成员变量的生命周期就被扩大了,具备了“全局”属性。这样做有如下几个坏处:

  1. 成员变量的声明周期大于所属对象的声明周期,所属对象销毁后,其“”成员变量”依旧存活。
  2. 成员变量可不经过所属对象直接做状态变更,状态变更难以跟踪。

违规代码:

class Resource
{
    private int num;
    private String name;

    public void setNum(int num) { this.num = num; }
    public int getNum() { return num; }
    public void setName(String name) { this.name = name; }
    public String getName() { return name; }
}

class ResourceMgr
{
     private List<Resource> resources;

    public List<Resource> getResources()
    {
        return resources;
    }
}

class DemoClass
{
    public void doSomething()
    {
        List<Resource> resources =  ResourceMgr.getInstance().getResources();
        for(Resource resource : resources)
        {
              if (resource.getName().equals("xxx"))
              {
                   //do business with resource
                   return;
              }
        }
    }
}

ResourceMgr管理一组Resource对象,但其却将内部管理的的resources列表直接返回至外部,成员变量生命周期被放大。一种可能的修改方案如下:

class ResourceMgr
{
     private List<Resource> resources;

    public List<Resource> find(String name)
    {
        return resources.stream().filter((resource) -> {
            return resource.getName().equals(name);
        }).findFirst().orElse(null);
    }
}

class DemoClass
{
    public void doSomething()
    {
        Resource resource = ResourceMgr.getInstance().find("xxx");
        if (resource == null)
        {
            return ;
        }

        ///do business with resource
    }
}

该方案提供一个查询接口,返回符合条件的资源对象。看似避免resources对外暴露,但返回的对象依旧为成员变量,本质上并无差别。真正合理的修改方案如下:

class Resource implements Cloneable { //!!!注意这里
    private int num;
    private String name;

    public void setNum(int num) {
        this.num = num;
    }

    public int getNum() {
        return num;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getName() {
        return name;
    }

    @Override
    public Resource clone() throws CloneNotSupportedException {
        return (Resource) super.clone();
    }
}

class ResourceMgr {
    private static ResourceMgr instance = new ResourceMgr();
    
    private List<Resource> resources = new ArrayList<>();
    
    private ResourceMgr() {
    }
    
    public static ResourceMgr getInstance() {
        return instance;
    }

    public Resource find(String name) {
        //查找符合条件的数据
        Resource resource = resources.stream().filter((r) -> {
            return r.getName().equals(name);
        }).findFirst().orElse(null);

        if (resource == null) {
            return null;
        }
        
        //!!!注意这里
        //返回cloneable对象
        try {
            return resource.clone();
        } catch (CloneNotSupportedException e) {
            return null;
        }
    }
}

class DemoClass
{
    public void doSomething()
    {
        Resource resource = ResourceMgr.getInstance().find("xxx");
        if (resource == null)
        {
            return ;
        }

        ///do business with resource
    }
}

为Resource实现Cloneable方法,find返回cloneable对象而非成员变量本身,有效避免成员变量的生命周期被放大。另外一种修改方案:

//!!!注意这里
interface IResource
{
    int getNum();
    String getName();
}

//!!!注意这里
class Resource implements IResource {
    private int num;
    private String name;

    public void setNum(int num) {
        this.num = num;
    }

    public int getNum() {
        return num;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getName() {
        return name;
    }
}

class ResourceMgr {
    private static ResourceMgr instance = new ResourceMgr();
    
    private List<Resource> resources = new ArrayList<>();
    
    private ResourceMgr() {
    }
    
    public static ResourceMgr getInstance() {
        return instance;
    }

    //!!!注意这里
    public IResource find(String name) {
        //查找符合条件的数据
        return resources.stream().filter((r) -> {
            return r.getName().equals(name);
        }).findFirst().orElse(null);
    }
}

class DemoClass
{
    public void doSomething()
    {
            //注意这里
        IResource resource = ResourceMgr.getInstance().find("xxx");
        if (resource == null)
        {
            return ;
        }

        ///do business with resource
    }
}

抽象一个接口类,find时返回接口IResource而非实现Resource对象。此时,成员变量的生命周期被放大,但对象的状态变更依旧在所属对象的控制之内。二者各有优缺点,到底使用哪种方案要根据具体使用场景而定。

上述两种方案都尝试解决控制成员变量的生命周期和状态变更的“可追踪性”,但如果我们期望的是更新符合find条件的对象,此时上述两种方案均不可取,而应在ResourceMgr中提供相应的接口,如下:

class ResourceMgr {
    private static ResourceMgr instance = new ResourceMgr();

    private List<Resource> resources = new ArrayList<>();

    private ResourceMgr() {
    }

    public static ResourceMgr getInstance() {
        return instance;
    }

    public boolean update(String name, int num) {
        Resource resource = resources.stream().filter((r) -> {
            return r.getName().equals(name);
        }).findFirst().orElse(null);

        if (resource == null) {
            return false;
        }

        resource.setNum(num);
        return true;
    }
}
  1. 示例:控制局部变量的生命周期

成员变量的生命周期控制在函数内部,因为其生命周期本身较短,我们通常疏于管理,使得生命周期放大,可读性降低。

违规代码:

    public void doSomething(List<Resource> resources, List<Device> devices) {
        int resourceChecksum = 0;
        int deviceChecksum = 0;
        int resourceTotal = 0;
        int deviceTotal = 0;
        int resourceAverage = 0;
        int deviceAverage =0;
        StringBuilder resourceStringBuilder = new StringBuilder();
        StringBuilder deviceStringBuilder = new StringBuilder();
        
        //计算resource的average、checksum
        for (Resource resource : resources) {
            resourceStringBuilder.append(resource.getName());
            resourceTotal += resource.getNum();
        }
        resourceChecksum = resourceStringBuilder.toString().hashCode();
        resourceAverage = resourceTotal / resources.size();
        
        //计算device的average、checksum
        for (Device device : devices) {
            deviceStringBuilder.append(device);
            deviceTotal += device.getNum();
        }
        deviceChecksum = deviceStringBuilder.toString().hashCode();
        deviceAverage = deviceTotal / devices.size();
        
        doAnoterThing(resourceChecksum, resourceAverage, deviceChecksum, deviceAverage);
    }

上述代码将所有的变量声明定义在函数顶部,但和device相关的变量只有在计算device时才需要,生命周期被放大。针对这点,可以做如下修改:

    public void doSomething(List<Resource> resources, List<Device> devices) {
        int resourceChecksum = 0;
        int resourceTotal = 0;
        int resourceAverage = 0;
        StringBuilder resourceStringBuilder = new StringBuilder();
        
        //计算resource的average、checksum
        for (Resource resource : resources) {
            resourceStringBuilder.append(resource.getName());
            resourceTotal += resource.getNum();
        }
        resourceChecksum = resourceStringBuilder.toString().hashCode();
        resourceAverage = resourceTotal / resources.size();
        
        int deviceChecksum = 0;
        int deviceTotal = 0;
        int deviceAverage =0;
        StringBuilder deviceStringBuilder = new StringBuilder();
        
        //计算device的average、checksum
        for (Device device : devices) {
            deviceStringBuilder.append(device.getIdentifier());
            deviceTotal += device.getNum();
        }
        deviceChecksum = deviceStringBuilder.toString().hashCode();
        deviceAverage = deviceTotal / devices.size();
        
        doAnoterThing(resourceChecksum, resourceAverage, deviceChecksum, deviceAverage);
    }

device相关变量生命周期缩小,可读性提高,但代码看起来还是不够整洁。仔细分析代码的最后一行,我们只需要resourceChecksum, resourceAverage, deviceChecksum, deviceAverage,但函数的生命周期中却增加了两个stringbuilder和两个total变量。我们期望这些临时变量的生命周期进一步降低,如下:

    public void doSomething(List<Resource> resources, List<Device> devices) {
        //计算resource的average、checksum
        int resourceChecksum = 0;
        int resourceAverage = 0;
        {
            int total = 0;
            StringBuilder stringBuilder = new StringBuilder();
            
            for (Resource resource : resources) {
                stringBuilder.append(resource.getName());
                total += resource.getNum();
            }
            resourceChecksum = stringBuilder.toString().hashCode();
            resourceAverage = total / resources.size();
        }


        //计算device的average、checksum
        int deviceChecksum = 0;
        int deviceAverage =0;
        {
            int total = 0;
            StringBuilder stringBuilder = new StringBuilder();
            
            for (Device device : devices) {
                stringBuilder.append(device.getIdentifier());
                total += device.getNum();
            }
            deviceChecksum = stringBuilder.toString().hashCode();
            deviceAverage = total / devices.size();
        }
        
        doAnoterThing(resourceChecksum, resourceAverage, deviceChecksum, deviceAverage);
    }   

经过二次重构后,我们不但降低了sting builder和total变量的生命周期,也避免了名称污染。不同场景下的string builder和total可以同名,代码可读性进一步提升。关于使用{}控制生命周期的技巧还有很多,不再一一列举。

3. 架构规约

3.7 规约7:针对扩展点编程

你愚弄了我一次,可耻的是你;但如果你愚弄了我两次,可耻的是我。
----《福尔摩斯:基本演绎法》

首先声明,这是一条附赠规约,不是说它不重要,而是因为以本文的篇幅,不可能讲通。针对扩展点编程是一个很大的话题,大到《设计模式》要花整本书来讲。本文只能提供一些指导建议,希望能有所帮助。

本节,我们讨论两个问题:什么是扩展点?以及如何针对扩展点编程?

4. 总结

本文讲了6条基本编程规约、1条架构指导规约。我尝试以最少的文字描述,帮助一线开发人员提升编码能力,但最后文章的篇幅还是超出了我的预期。

同样,限于本文的篇幅,有太多的细节没有展开,好在有前辈早已帮我们整理成文。如本文最开始说的,如果你真正的想提高自身的编码、架构能力,请仔细翻阅以下书籍(建议按先后顺序阅读):

  1. 《重构--改善既有代码的设计》
  2. 《代码大全》
  3. 《敏捷软件开发--原则、模式与实践》
  4. 《设计模式--可复用面向对象软件的基础》
  5. 《领域驱动设计--软件核心复杂性应对之道》
  6. 《计算机程序的构造和解释》

(完)


【转载请注明】随安居士. 软件编程基础规约. 2018.06.13

上一篇下一篇

猜你喜欢

热点阅读