正则表达式匹配

题目

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

 
示例 1:

输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。

示例 2:

输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。

示例 3:

输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。

提示:

1 <= s.length <= 20
1 <= p.length <= 20
s 只包含从 a-z 的小写字母。
p 只包含从 a-z 的小写字母,以及字符 . 和 *。
保证每次出现字符 * 时,前面都匹配到有效的字符

思路

状态定义:记s的长度为m,p的长度为n,dp = vector<vector>(m+1,vector<n+1>(n+1))

定义dpi表示串s[0,i-1],p[0,j-1]能否匹配。则dp[i][j]取决于s[i-1],p[j-1]的情况。

p[j-1]有三种可能,"*",".","a-z"。
1、如果p[j-1]="a-z",则判断s[i-1]和p[j-1]是否相等,如果相等,则dp[i][j] = dp[i-1][j-1]
如果不等,则dp[i][j] = false。
2、如果p[j-1]=='.',则dp[i][j] = dp[i-1][j-1]。
3、如果p[j-1] == '*',则判断s[i-1]和p[j-2]是否相等,如果相等,则dp[i][j] = dp[i-1][j]。
如果不等,则dp[i][j] = dp[i][j-2]

边界dp[0][0] = true,空字符串和空字符串是可以匹配的。s为空字符串,p为不空,则有可能匹配。

s为不空,p为空字符串,则不可能匹配上。即dp[1,m][0] == false。

dp[i][j]由dp[i-1][j],dp[i-1][j-1],dp[i][j-2]推导而来,所以应该i,j从小到大遍历

dp[m][n]即为答案。

代码

class Solution {
public:
    bool isMatch(string s, string p) {
        int m = s.size();
        int n = p.size();
        //这样写,减少了很多判断。
        auto matches = [&](int i, int j) {
            if (i == 0) {
                return false;
            }
            if (p[j - 1] == '.') {
                return true;
            }
            return s[i - 1] == p[j - 1];
        };

        vector<vector<int>> dp(m + 1, vector<int>(n + 1));
        dp[0][0] = true;
        for (int i = 0; i <= m; ++i) {
            for (int j = 1; j <= n; ++j) {//j从1开始,因为dp[1,i][0]不可能匹配上
                if (p[j - 1] == '*') {
                    dp[i][j] |= dp[i][j - 2];
                    if (matches(i, j - 1)) {
                        dp[i][j] |= dp[i - 1][j];
                    }
                }
                else {
                    if (matches(i, j)) {
                        dp[i][j] |= dp[i - 1][j - 1];
                    }
                }
            }
        }
        return dp[m][n];
    }
};