欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Java 正则表达式匹配模式(贪婪型、勉强型、占有型)

程序员文章站 2022-06-23 11:24:36
greediness(贪婪型):最大匹配 x?、x*、x+、x{n,} 是最大匹配。例如你要用 “<.+>” 去匹配 “aaava...

greediness(贪婪型):最大匹配

x?、x*、x+、x{n,} 是最大匹配。例如你要用 “<.+>” 去匹配 “a<tr>aava </tr>abb”,也许你所期待的结果是想匹配 “<tr>”,但是实际结果却会匹配到 “<tr>aava </tr>。

在 greediness 的模式下,会尽量大范围的匹配,直到匹配了整个内容,这时发现匹配不能成功时,开始回退缩小匹配范围,直到匹配成功

string test = "a<tr>aava </tr>abb ";
string reg = "<.+>";
system.out.println(test.replaceall(reg, "###"));

输出:a###abb

reluctant(laziness)(勉强型):最小匹配
x??、x*?、x+?、x{n,}? 是最小匹配,其实x{n,m}?和x{n }?有些多余。在 greediness 模式之后添加 ? 就成最小匹配。

在 reluctant 的模式下,只要匹配成功,就不再继续尝试匹配更大范围的内容

string test = "a<tr>aava </tr>abb ";
string reg = "<.+?>";
system.out.println(test.replaceall(reg, "###"));

输出:a###aava ###abb

与 greediness 不同,reluctant 模式下匹配了两次内容

possessive(占有型):完全匹配
x?+、x*+、x++、x{n,}+ 是完全匹配,在 greediness 模式之后添加 + 就成完全匹配。

possessive 模式与 greediness 有一定的相似性,那就是都尽量匹配最大范围的内容,直到内容结束,但与 greediness 不同的是,完全匹配不再回退尝试匹配更小的范围。

string test = "a<tr>aava </tr>abb ";
string reg = "<.++>";
string test2 = "<tr>";
string reg2 = "<tr>";
system.out.println(test.replaceall(reg, "###"));
system.out.println(test2.replaceall(reg2, "###"));

输出:a<tr>aava </tr>abb