正则表达式匹配

题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符 '*' 匹配零个或多个前面的那一个元素 所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

  示例 1:

输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
``` 

提示:

1 <= s.length <= 20 1 <= p.length <= 20 s 只包含从 a-z 的小写字母。 p 只包含从 a-z 的小写字母,以及字符 . 和 。 保证每次出现字符  时,前面都匹配到有效的字符

###思路
状态定义:记s的长度为m,p的长度为n,dp = vector<vector<bool>>(m+1,vector<n+1>(n+1))

定义dp[i][j]表示串s[0,i-1],p[0,j-1]能否匹配。则dp\[i\]\[j\]取决于s[i-1],p[j-1]的情况。

p[j-1]有三种可能,"*",".","a-z"。
1、如果p[j-1]="a-z",则判断s[i-1]和p[j-1]是否相等,如果相等,则dp\[i\]\[j\] = dp\[i-1\]\[j-1\]
如果不等,则dp\[i\]\[j\] = false。
2、如果p[j-1]=='.',则dp\[i\]\[j\] = dp\[i-1\]\[j-1\]。
3、如果p[j-1] == '*',则判断s[i-1]和p[j-2]是否相等,如果相等,则dp\[i\]\[j\] = dp\[i-1\]\[j\]。
如果不等,则dp\[i\]\[j\] = dp\[i\]\[j-2\]

边界dp\[0\]\[0\] = true,空字符串和空字符串是可以匹配的。s为空字符串,p为不空,则有可能匹配。

s为不空,p为空字符串,则不可能匹配上。即dp\[1,m\][0] == false。

dp\[i\]\[j\]由dp\[i-1\]\[j\],dp\[i-1\]\[j-1\],dp\[i\]\[j-2\]推导而来,所以应该i,j从小到大遍历

dp\[m\]\[n\]即为答案。

###代码

class Solution { public: bool isMatch(string s, string p) { int m = s.size(); int n = p.size(); //这样写,减少了很多判断。 auto matches = [&](int i, int j) { if (i == 0) { return false; } if (p[j - 1] == '.') { return true; } return s[i - 1] == p[j - 1]; };

    vector<vector<int>> dp(m + 1, vector<int>(n + 1));
    dp[0][0] = true;
    for (int i = 0; i <= m; ++i) {
        for (int j = 1; j <= n; ++j) {//j从1开始,因为dp[1,i][0]不可能匹配上
            if (p[j - 1] == '*') {
                dp[i][j] |= dp[i][j - 2];
                if (matches(i, j - 1)) {
                    dp[i][j] |= dp[i - 1][j];
                }
            }
            else {
                if (matches(i, j)) {
                    dp[i][j] |= dp[i - 1][j - 1];
                }
            }
        }
    }
    return dp[m][n];
}

};