正则表达式如何处理嵌套结构

2018-03-30  本文已影响0人  CrixalisAs

1、 .net处理嵌套结构的方法

举例说明:

问题描述:从before (nope (yes (here) okay) after中匹配得到最大的被”()”包含的文本。即显示红色的部分。

答案:.net:\((?>[^()]+|\((?<DEPTH>)|\)(?<-DEPTH>))*(?(DEPTH)(?!))\)

分析:

2, 如何使用正则表达式处理句法分析树

如何使用正则表达式识别一棵类似如下表示的句法分析树?

(TOP (S (NPB (DT The) (NN question) ) (VP (VBZ remains) (SBAR-A (IN whether) (S-A (NPB (PRP they) ) (VP (MD will) (VP-A (VB be) (ADJP (JJ able) (SG (VP (TO to) (VP-A (VB help) (PUNC. us.) ) ) ) ) ) ) ) ) ) ) )

答案:\((?>[^()]+|\([^()\s]+\s(?<DEPTH>)|\)\s(?<-DEPTH>))*(?(DEPTH)(?!))\)

分析类似。

3, 使用正则表达式处理句法分析树实例

\(NP\s(?>[^()]+|\([^()\s]+\s(?<DEPTH>)|\)\s(?<-DEPTH>))*(?(DEPTH)(?!))\)

i. 该子句的标记为SBAR[^()]*

ii. 该子句根节点的第一个儿子为一个词性为IN的词。

iii. 该子句的第二个儿子为一个子句:使用S[^()]*识别

iv. 该子句没有其他的儿子

(?<Clause>\(S[^() ]\s(?<INWH>\(IN\s[^()]+\)\s)(?<ClauseAfterInWh>\(S[^() ]\s(?>[^()]+|\([^()\s]+\s(?<DEPTH>)|\)\s(?<-DEPTH>))*(?(DEPTH)(?!))\)\s)\)\s(?#Clause))

上一篇 下一篇

猜你喜欢

热点阅读