正则匹配算法题
程序员文章站
2024-03-22 18:03:28
...
- 判断给出的正则表达式是否能适配,这里正则表达式的适配规则是:
- "." 适配任意单个字符
- "x*" 适配0个或者多个x字符
isMatch("aa","a") → false isMatch("aa","aa") → true isMatch("aaa","aa") → false isMatch("aa", "a*") → true isMatch("aa", ".*") → true isMatch("ab", ".*") → true isMatch("aab", "c*a*b") → true
思路
- 首先要理解题意:
- "a"对应"a", 这种匹配不解释了
- 任意字母对应".", 这也是正则常见
- 0到多个相同字符x,对应"x*", 比起普通正则,这个地方多出来一个前缀x. x代表的是相同的字符中取一个,比如"aaaab"对应是"a*b"
- "*"还有一个易于疏忽的地方就是它的"贪婪性"要有一个限度.比如"aaa"对应"a*a",代码逻辑不能一路贪婪到底
- 正则表达式如果期望着一个字符一个字符的匹配,是非常不现实的.而"匹配"这个问题,非常容易转换成"匹配了一部分",整个匹配不匹配,要看"剩下的匹配"情况.这就很好的把一个大的问题转换成了规模较小的问题:递归
- 确定了递归以后,使用java来实现这个问题,会遇到很多和c不一样的地方,因为java对字符的控制不像c语言指针那么灵活charAt一定要确定某个位置存在才可以使用.
- 如果pattern是"x*"类型的话,那么pattern每次要两个两个的减少.否则,就是一个一个的减少. 无论怎样减少,都要保证pattern有那么多个.比如s.substring(n), 其中n最大也就是s.length()
public class Solution {
public boolean isMatch(String s, String p) {
if (p.length() == 0) {
return s.length() == 0;
}
// length == 1 is the case that is easy to forget.
// as p is subtracted 2 each time, so if original
// p is odd, then finally it will face the length 1
if (p.length() == 1) {
return (s.length() == 1)
&& (p.charAt(0) == s.charAt(0) || p.charAt(0) == '.');
}
// next char is not '*': must match current character
if (p.charAt(1) != '*') {
if (s.length() < 1) {
return false;
} else {
return (s.charAt(0) == p.charAt(0) || p.charAt(0) == '.')
&& isMatch(s.substring(1), p.substring(1));
}
}
// next char is *
while (s.length() > 0
&& (p.charAt(0) == s.charAt(0) || p.charAt(0) == '.')) {
if (isMatch(s, p.substring(2))) {
return true;
}
s = s.substring(1);
}
return isMatch(s, p.substring(2));
}
}
class Solution { public: bool isMatch(string s, string p) { if (p.empty()) return s.empty(); if (p.size() > 1 && p[1] == '*') { return isMatch(s, p.substr(2)) || (!s.empty() && (s[0] == p[0] || p[0] == '.') && isMatch(s.substr(1), p)); } else { return !s.empty() && (s[0] == p[0] || p[0] == '.') && isMatch(s.substr(1), p.substr(1)); } } };聪明
我们也可以用DP来解,定义一个二维的DP数组,其中dp[i][j]表示s[0,i)和p[0,j)是否match,然后有下面三种情况(下面部分摘自这个帖子):
1. P[i][j] = P[i - 1][j - 1], if p[j - 1] != '*' && (s[i - 1] == p[j - 1] || p[j - 1] == '.'); 2. P[i][j] = P[i][j - 2], if p[j - 1] == '*' and the pattern repeats for 0 times; 3. P[i][j] = P[i - 1][j] && (s[i - 1] == p[j - 2] || p[j - 2] == '.'), if p[j - 1] == '*' and the pattern repeats for at least 1 times.
class Solution { public: bool isMatch(string s, string p) { int m = s.size(), n = p.size(); vector<vector<bool>> dp(m + 1, vector<bool>(n + 1, false)); dp[0][0] = true; for (int i = 0; i <= m; ++i) { for (int j = 1; j <= n; ++j) { if (j > 1 && p[j - 1] == '*') { dp[i][j] = dp[i][j - 2] || (i > 0 && (s[i - 1] == p[j - 2] || p[j - 2] == '.') && dp[i - 1][j]); } else { dp[i][j] = i > 0 && dp[i - 1][j - 1] && (s[i - 1] == p[j - 1] || p[j - 1] == '.'); } } } return dp[m][n]; } };
上一篇: 5. 使用通配符进行过滤(%,_)
下一篇: LeetCode---反转链表
推荐阅读
-
树的基础算法题
-
正则匹配算法题
-
〖算法面试刷题〗windows10系统中visual studio code配置c/c++开发环境!
-
LeetCode Hot 热题100 算法题 234.回文链表-算法&测试-easy模式
-
LeetCode Hot 热题100 算法题 283.移动零-算法&测试-easy模式
-
LeetCode Hot 热题100 算法题 160.相交链表-算法&测试-easy模式
-
〖算法面试刷题〗C++动态数组类vector!
-
LeetCode Hot 热题100 算法题 141.环形链表-算法&测试-easy模式
-
LeetCode Hot 热题100 算法题 1.两数之和 -算法&测试-easy模式
-
LeetCode Hot 热题100 算法题 461.汉明距离-算法&测试-easy模式