C语言

实现简易的C语言编译器(part 4)

2019-07-25  本文已影响0人  为了忘却的程序猿

        我们紧接着上一部分的内容,继续讨论表达式。
        有了上一部分的基础,相信大家对这样的抽象描述已经有所了解了。类似的,我们可以直接写出包含关系和逻辑运算符的表达式的描述。

relation_expression : additive_expression
                    | relation_expression < additive_expression
                    | relation_expression <= additive_expression
                    | relation_expression > additive_expression
                    | relation_expression >= additive_expression

equality_expression : relation_expression
                    | equality_expression == relation_expression
                    | equality_expression != relation_expression

logical_and_expression : equality_expression
                       | logical_and_expression && equality_expression

logical_or_expression : logical_and_expression
                      | logical_or_expression || logical_and_expression

        不知道大家有没有注意到一个细节:这些表达式为何这样安排?这其实涉及到C语言中运算符优先级的问题,例如:&&就比||优先级高。也就是说,在列出的这些表达式描述中,运算符优先级从上到下依次递减。其实,在上一部分我们处理四则运算表达式时也是基于同样的考虑:乘除法优先级高于加减法。只是这里列出的由表达式顺序决定运算符优先级的方式更加明显而已。
        在写出带赋值运算符的表达式之前,我们需要理解一下C语言中的两个概念:左结合右结合

        再回过头看之前我们写出来的这些表达式的描述方法,它们都出现在自己运算符的左边,这样保证了我们能够按照左结合的方式去处理。那么,触类旁通,包含赋值运算符的表达式的描述就该写成:

expression : logical_or_expression
           | logical_or_expression = expression

我不知道商业化的编译器是怎样实现的这个过程,但是通过学习这部分的内容,对于C语言表达式的运算实际结果就有了一个清晰的认识,知其然也知其所以然了。
我们将表达式的这些描述方法都汇总起来,之前用primary_expression表示的,现在可以都用expression来描述,这样就扩展了C语言所支持的表达式形式的范围。例如,primary_expression可以更新为:

primary_expression : ( expression )
                   | CHAR
                   | INT
                   | ID

        到此,我们的表达式描述已经基本上涵盖了C语言中出现的大部分表达式,剩下没有出现的我们将在后面进行介绍。
        至于实现,都大同小异,这里就不在重复了。

3.2 语句(statement)

        在前面的表达式中,我们从最小单元primary_expression起逐渐构建起最终完整的表达式expression。但是,和表达式的这种自底向上的分析方法相反,我们需要采用自顶向下的方式来分析C语言中出现的语句,因为语句都是层层嵌套的,并不按照递归的方式进行实现。因此,为了方便,我们将语句分成以下几类:

expression_statement : expression ;
jump_statement : RETURN ;
               | RETURN expression ;
               | BREAK ;
               | CONTINUE ;
iteration_statement : FOR ( expression ; expression ; expression ) statement
                    | WHILE ( expression ) statement
                    | DO statement WHILE ( expression ) ;

这里的statement就是所有语句的集合。

selection_statement : IF ( expression ) statement
                    | IF ( expression ) statement ELSE statement
compound_statement : { declaration_list }
                   | { declaration_list statement_list }

这里的statement_listdeclaration_list是语句和声明的组合,可以描述为:

statement_list : statement 
               | statement_list statement

declaration_list : declaration 
                 | declaration_list declaration
empty_statement : ;

        最后,我们将这些语句组合在一起,得到最终的语句集合描述:

statement : expression_statement
          | jump_statement
          | iteration_statement
          | selection_statement
          | compound_statement
          | empty_statement

        一旦搭建了底层的实现模板,不管是表达式还是语句,只需要按照这样的一种模式,就能非常简单快速地编写语法分析的实现代码了,具体代码我们会在后面介绍。
        语法分析的过程就是这样,给定期望的语法模板,如果匹配,就进行下一项匹配;否则,停止并返回错误。下一部分即将分析的声明部分也是这样,大家可以看一看C语言代码,如何归纳总结出它们的描述。

实现简易的C语言编译器(part 0)
实现简易的C语言编译器(part 1)
实现简易的C语言编译器(part 2)
实现简易的C语言编译器(part 3)
实现简易的C语言编译器(part 5)
实现简易的C语言编译器(part 6)
实现简易的C语言编译器(part 7)
实现简易的C语言编译器(part 8)
实现简易的C语言编译器(part 9)

上一篇 下一篇

猜你喜欢

热点阅读