[Leetcode]10. 正则表达式匹配
题目描述:
给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '' 的正则表达式匹配。
'.' 匹配任意单个字符。
'' 匹配零个或多个前面的元素。
匹配应该覆盖整个字符串 (s) ,而不是部分字符串。
说明:
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
-
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。 -
示例 2:
输入:
s = "aa"
p = "a"
输出: true
解释: '' 代表可匹配零个或多个前面的元素, 即可以匹配 'a' 。因此, 重复 'a' 一次, 字符串可变为 "aa"。 -
示例 3:
输入:
s = "ab"
p = "."
输出: true
解释: "." 表示可匹配零个或多个('*')任意字符('.')。 -
示例 4:
输入:
s = "aab"
p = "cab"
输出: true
解释: 'c' 可以不被重复, 'a' 可以被重复一次。因此可以匹配字符串 "aab"。 -
示例 5:
输入:
s = "mississippi"
p = "misisp*."
输出: false
笨办法1:
直接逐个字母的比对肯定是不行的。我能够想到的一个也许可行的思路是:使用list+dict来记录整个字符串。具体来说,就是记录下字符串中每个字符连续出现的次数。比如:aab记录为[{'a':2},{'b':1}],mississippi记录为[{'m':1},{'i':1},……],以此类推。而对于包含*或者.的字符串,则进行转义。
进行转义的时候,需要考虑以下几种情况:
- 字母后接时,例如a,记录为{a:star}
- 字母后接.时,例如a.,记录为{a:1, dot:1}
- .后接时,例如.,记录为{dot:star},表示0个或多个任意字符
- 后接.时,例如a.,记录为{a:1+star,dot:1}
- 开头时,例如abc,记录为{a:1,b:1,c:1},此时*不起作用
- .开头时,例如.abc,记录为{dot:1,a:1,b:1,c:1},.相当于一个字符
说到底,*代表的是数量,作为dict的value存在。.代表的是字符,作为dict的key存在。
即便做了转换,也还是无法通过逐个字符比对来判定是否匹配。说到底,这能算是一个初级的思路,最终证明难以用来解决问题。
笨办法2:
最后,直接使用re库的match方法。没想到很多人也是用的re库来解决,并不算取巧哇。因为re.match方法还是有些参数比较特别,人们也不一定清楚怎么用。re.match('a.*','ab').group(0)=='ab',这就表示匹配成功。
耗时84ms,战胜了72%的用户。
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
import re
m=re.match(p,s)
if m and m.span()[1]==len(s):
return True
else:
return False
聪明的方法:
没想到是使用递归+动态规划的思路解决,当然也可以用纯递归的思路解决。我有考虑过动态规划,但没有考虑过用递归+动态规划的方法。
其实这题的思路,关键还是递归,为什么呢?单纯匹配.很容易,关键是*的匹配。如果逐个字符的匹配,处理逻辑很复杂。但用递归来处理就简单多了,问题就简化为以下两种情况:
- 如果s[0]==p[0] and p[1]=='*',只要s[1:]==p[2:],两个字符串就相等。
- 如果s[0]==p[0] and p[1]!='*',只要s[1:]==p[1:],两个字符串就相等。
递归可以处理s中包含任意多个连续的相同字符的情况。用其余的思路都很难处理。
用时1848ms,击败6.7%的用户。
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
# 如果not p非空,也就是p为空,则返回not s
if not p:
return not s
# 下面处理p非空的情况
# 检测首字符是否相等
first_match=bool(s) and p[0] in (s[0],'.')
# 递归处理后续字符
# 首字符相等 且 后续字符匹配
# 考虑只有两个字符和两个以上字符的情况
if len(p)>=2 and p[1]=='*':
#同时考虑首字母不匹配和首字母匹配的情况
return self.isMatch(s,p[2:]) or (first_match and self.isMatch(s[1:],p))
else:
return first_match and self.isMatch(s[1:],p[1:])
用动态规划+递归的思想,可以更快的解决这个问题。这个解法的核心与递归解法类似,但时间复杂度是O(S*P)。该解法中,关键要搞清楚结束条件是:i和j同时移动到末尾。如果没有同时移动到末尾,比如j移动到了末尾,而i只到中间位置,那么s和p便不匹配。
用时44ms,击败了98.5%的用户。
class Solution(object):
def isMatch(self, s, p):
"""
:type s: str
:type p: str
:rtype: bool
"""
memo={} #存储动态规划的结果
#dp(i,j)表示s[i:]和p[j:]是否匹配
def dp(i,j):
if (i,j) not in memo:
#结束条件:i和j同时移动到末尾
if j==len(p):
ans=i==len(s)
else:
# 类似于递归解法,关键是搞清楚dp(i,j)表示s[i:]和p[j:]是否匹配
first_match=i<len(s) and p[j] in (s[i],'.')
if j+1<len(p) and p[j+1]=='*':
ans=dp(i,j+2) or first_match and dp(i+1,j)
else:
ans=first_match and dp(i+1,j+1)
memo[i,j]=ans
return memo[i,j]
return dp(0,0)