编译器笔记16-语法分析-LALR分析法

2019-11-24  本文已影响0人  衣忌破

LALR分析法的提出

LR(1)分析法实际上是根据展望符集合的不同将原始的LR(0)项目进行分裂,分裂成不同的LR(1)项目。这就使得LR(1)的状态数较LR(0)的状态数多了很多。 比如说C语言的语法在构造其LR(0)分析表的时候通常只有几百个状态,而构造其LR(1)语法的时候会有几千个状态。为了使LR(1)实用化,必须要想办法去减少其状态数。

LALR分析法的提出.png

如上图有4对同心项目集,I4与I11,I7与I13,I8与I10,I5与I12,把没有状态冲突的项目进行合并可以大大减少自动机的状态数,空间上会更节省。这就是LALR分析法的基本思想。

LALR( lookahead-LR)分析的基本思想

合并同心项集

合并同心项集1.png 合并同心项目集2.png

当第一次了解到合并同心项目这样的操作时,可能会产生这样的疑问,如上图中将I4与I11合并,合并后加入从状态6进入状态4后遇到下一个输入符号为=时逻辑上应该是要报错的,但如果按照合并后的LALR可以看出I4状态下遇上=也会进行归约操作。这种情况其实就设计到LALR的延迟处理下文将会有提及。

合并同心项集时产生归约-归约冲突的例子

归约-归约冲突.png

状态6与状态9是一对同心项目集,即它们的LR(0)项目是相同的。但这两个状态合并会发生归约-归约冲突,合并后当遇到d时无法判断c该归约至A还是B。同理遇到输入e时也会出现这种情况。

虽然合并同心项目可能会产生归约-归约冲突,但不会产生移入-归约冲突,是因为同心项目集在合并时只是合并展望符集合,而展望符只在归约时起作用在移入是不起作用的,因此只要合并前项目不存在移入-归约冲突的话合并后也不存在移入-归约冲突。

合并同心项集缺点

合并同心项集后,虽然不产生冲突,但可能会推迟错误的发现

推迟错误的发现.png

过程:

  1. 因为状态9合并至状态4,当输入d$时d移入栈后会进入状态4。
  2. d归约成A后,d跟状态4出栈,A进栈,状态栈露出状态0。
  3. 0状态遇到A后进入状态2,状态2进栈。
  4. 接着$进栈,状态2遇到$后报错。
    可见如果状态4在跟状态9合并前,在进入状态4前就已经报错。而合并后却进行额外的操作直至进入状态2才报错。可见合并同心项目集后确实推迟了错误的发现。

实际上合并同心项目时合并的其实是对应项的展望符集合,而移入动作与展望符没有任何关系,因此合并展望符集合不会影响移入操作的正确性。

LALR(1)的特点

形式上与LR(1)相同.png 大小上与LR(0)SLR相当.png

SLR<LALR(1)<LR(1)

合并后的展望符集合仍为FOLLOW集的子集

LALR相对于LR(1)会延迟错误的发现,因此其分析能力会低于LR(1)分析法。但其对信息的划分比SLR分析法更细致,因此它延迟发生的错误要比SLR分析要少分析能力也就比SLR分析要强。

上一篇下一篇

猜你喜欢

热点阅读