Java实现每日一道算法面试题（13）：leecode10 正则

2020-03-16 本文已影响0人 alexlee1987

1.算法题目

给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配，是要涵盖整个字符串 s的，而不是部分字符串。

说明:

s 可能为空，且只包含从 a-z 的小写字母。
p 可能为空，且只包含从 a-z 的小写字母，以及字符 . 和 *。
示例 1:

输入:

s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此，字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个（'*'）任意字符（'.'）。

示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个，这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。

示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

2.算法思路

算法思路：

回溯算法：如果没有 ‘*’ ，问题会很简单——只需要从左到右检查匹配
串 s 是否能匹配模式串 p 的每一个字符。当模式串 p 中有星号时，我们需要检查匹配串 s 中的不同后缀，以判断它们是否能匹配模式串 p 剩余的部分。一个直观的解法就是用回溯的方法来体现这种关系。如果模式串中有星号，它会出现在第二个位置，即 p[1] 。这种情况下，我们可以直接忽略模式串中这一部分，或者删除匹配串的第一个字符，前提是它能够匹配模式串当前位置字符，即 p[0] 。如果两种操作中有任何一种使得剩下的字符串能匹配，那么初始时，匹配串和模式串就可以被匹配。该算法时间复杂度比较高，而且与两个字符串的长度以及长度次方关联，不是一个理想的算法；
动态规划：正则表达式匹配时匹配串 p 其实也是模式串 s 的最优子结构，可以考虑把中间结果保存起来，通过用 dp(i, j, text, pattern) 表示 text[i:] 和 pattern[j:] 是否能匹配。进而可以用更短的字符串匹配问题来表示原来的问题。

3.算法代码

算法代码：

    /**
     * leecode10：正则表达式匹配
     * @param s
     * @param p
     * @return
     */
    public static boolean isMatch(String s, String p) {
        // 初始化匹配结果数组长度
        memo = new Result[s.length() + 1][p.length() + 1];
        return dp(0, 0, s, p);
    }
    
    // 定义枚举常量
    enum Result {
        TRUE, FALSE
    }
    
    // 保存匹配的结果
    static Result[][] memo;

    public static boolean dp(int i, int j, String text, String pattern) {
        if (memo[i][j] != null) {
            return memo[i][j] == Result.TRUE;
        }
        boolean ans;
        if (j == pattern.length()){
            ans = i == text.length();
        } else{
            // 判断当前的第一个字符是否匹配
            boolean first_match = (i < text.length() &&
                    (pattern.charAt(j) == text.charAt(i) ||
                            pattern.charAt(j) == '.'));

            if (j + 1 < pattern.length() && pattern.charAt(j+1) == '*'){ // 匹配"a*" 时分两种场景：1.不考虑当前是否匹配到“a*”，直接匹配 p后面的字符串；2.保留当前的匹配，若当前字符匹配，则继续匹配 s 后面的字符串
                ans = dp(i, j+2, text, pattern) ||
                        first_match && dp(i+1, j, text, pattern);
            } else { // 正常匹配场景
                ans = first_match && dp(i+1, j+1, text, pattern);
            }
        }
        memo[i][j] = ans ? Result.TRUE : Result.FALSE;
        return ans;
    }

如果你有疑问或更好的算法思路，欢迎留言交流！！！
如果感觉我的文章对您有所帮助，麻烦动动小手给个喜欢，谢谢！！！

Java实现每日一道算法面试题（13）：leecode10 正则

1.算法题目

2.算法思路

3.算法代码

猜你喜欢

热点阅读