【剑指Offer】052——正则表达式匹配 (字符串)
2019-08-21 本文已影响0人
就问皮不皮
题目描述
请实现一个函数用来匹配包括’.’和’*’的正则表达式。模式中的字符’.’表示任意一个字符,而’*’表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串”aaa”与模式”a.a”和”ab*ac*a”匹配,但是与”aa.a”和”ab*a”均不匹配
解题思路
当模式中的第二个字符不是“*”时:
1、如果字符串第一个字符和模式中的第一个字符相匹配,那么字符串和模式都后移一个字符,然后匹配剩余的。
2、如果字符串第一个字符和模式中的第一个字符相不匹配,直接返回false。
而当模式中的第二个字符是“*”时:
如果字符串第一个字符跟模式第一个字符不匹配,则模式后移2个字符,继续匹配。如果字符串第一个字符跟模式第一个字符匹配,可以有3种匹配方式:
1、模式后移2字符,相当于x*被忽略;
2、字符串后移1字符,模式后移2字符;
3、字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位。
参考代码
Java
public class Solution {
public boolean match(char[] str, char[] pattern)
{
int sindex = 0, pindex = 0;
// 递归匹配
return matchCore(str, sindex, pindex, pattern);
}
/**
*
* @param str 需要检测的字符串
* @param sindex str的检测索引
* @param pindex 模式的索引
* @param pattern 模式
* @return
*/
public boolean matchCore(char[] str, int sindex, int pindex, char[] pattern){
// 表示已经检测结束(递归出口)
if(sindex >= str.length && pindex == pattern.length)
return true;
// 模式检测完毕,而字符串没有结束(递归出口)
if(pindex >= pattern.length && sindex < str.length)
return false;
// 模式的第二个字符是*情况
if(pindex+1 < pattern.length && pattern[pindex+1] == '*'){
// 当前字符与模式当前字符相同,或者模式当前字符是.
if(sindex < str.length && (str[sindex] == pattern[pindex] || pattern[pindex] == '.') ){
// 三种情况:
// 1.模式后移2字符,相当于x*被忽略;模式匹配的字符只出现零次
// 2.字符串后移1字符,模式后移2字符;模式匹配的字符只出现一次
// 3.字符串后移1字符,模式不变,即继续匹配字符下一位,因为*可以匹配多位。模式匹配的字符出现多余一次
return matchCore(str, sindex, pindex+2, pattern) ||
matchCore(str, sindex+1, pindex+2, pattern ) ||
matchCore(str, sindex+1, pindex, pattern);
}else{
// 直接后移两位,str[sindex] != pattern[pindex] && pattern[pindex] != '.'
// 也就是说模式中:"字符*"情形在字符串中不存在,直接忽略这2为模式符
return matchCore(str, sindex, pindex+2, pattern);
}
}
// 模式第二个字符不是*情况
if(sindex < str.length && (str[sindex] == pattern[pindex] || pattern[pindex] == '.'))
return matchCore(str, sindex+1, pindex+1, pattern);
return false;
}
}
Python
# -*- coding:utf-8 -*-
class Solution:
# s, pattern都是字符串
def match(self, s, pattern):
# write code here
if len(s) == 0 and len(pattern) == 0:
return True
if len(s) > 0 and len(pattern) == 0:
return False
if len(pattern) > 1 and pattern[1] == '*':
if len(s) > 0 and (s[0] == pattern[0] or pattern[0] == '.'):
return self.match(s, pattern[2:]) or self.match(s[1:], pattern[2:]) or self.match(s[1:], pattern)
else:
return self.match(s, pattern[2:])
if len(s) >0 and (pattern[0] == "." or pattern[0] == s[0]):
return self.match(s[1:], pattern[1:])
return False
个人订阅号
image