Java 正则表达式匹配模式(贪婪型、勉强型、占有型)

程序员文章站 2022-06-23 11:24:36

greediness（贪婪型）：最大匹配 x?、x*、x+、x{n，} 是最大匹配。例如你要用 “<.+>” 去匹配 “aaava...

greediness（贪婪型）：最大匹配

x?、x*、x+、x{n，} 是最大匹配。例如你要用 “<.+>” 去匹配 “a<tr>aava </tr>abb”，也许你所期待的结果是想匹配 “<tr>”，但是实际结果却会匹配到 “<tr>aava </tr>。

在 greediness 的模式下，会尽量大范围的匹配，直到匹配了整个内容，这时发现匹配不能成功时，开始回退缩小匹配范围，直到匹配成功

string test = "a<tr>aava </tr>abb ";
string reg = "<.+>";
system.out.println(test.replaceall(reg, "###"));

输出：a###abb

reluctant(laziness)（勉强型）:最小匹配
x??、x*?、x+?、x{n，}? 是最小匹配，其实x{n，m}?和x{n }?有些多余。在 greediness 模式之后添加 ? 就成最小匹配。

在 reluctant 的模式下，只要匹配成功，就不再继续尝试匹配更大范围的内容

string test = "a<tr>aava </tr>abb ";
string reg = "<.+?>";
system.out.println(test.replaceall(reg, "###"));

输出：a###aava ###abb

与 greediness 不同，reluctant 模式下匹配了两次内容

possessive（占有型）：完全匹配
x?+、x*+、x++、x{n，}+ 是完全匹配，在 greediness 模式之后添加 + 就成完全匹配。

possessive 模式与 greediness 有一定的相似性，那就是都尽量匹配最大范围的内容，直到内容结束，但与 greediness 不同的是，完全匹配不再回退尝试匹配更小的范围。

string test = "a<tr>aava </tr>abb ";
string reg = "<.++>";
string test2 = "<tr>";
string reg2 = "<tr>";
system.out.println(test.replaceall(reg, "###"));
system.out.println(test2.replaceall(reg2, "###"));

输出：a<tr>aava </tr>abb

上一篇：正则表达式d元字符(相对于数字0-9)

下一篇：正则表达式.号元字符(除了回车符和换行符 )

Java 正则表达式匹配模式(贪婪型、勉强型、占有型)