Java 正则表达式匹配模式(贪婪型、勉强型、占有型)
程序员文章站
2022-03-10 21:55:20
greediness(贪婪型):最大匹配
x?、x*、x+、x{n,} 是最大匹配。例如你要用 “<.+>” 去匹配 “aaava...
greediness(贪婪型):最大匹配
x?、x*、x+、x{n,} 是最大匹配。例如你要用 “<.+>” 去匹配 “a<tr>aava </tr>abb”,也许你所期待的结果是想匹配 “<tr>”,但是实际结果却会匹配到 “<tr>aava </tr>。
在 greediness 的模式下,会尽量大范围的匹配,直到匹配了整个内容,这时发现匹配不能成功时,开始回退缩小匹配范围,直到匹配成功
string test = "a<tr>aava </tr>abb "; string reg = "<.+>"; system.out.println(test.replaceall(reg, "###"));
输出:a###abb
reluctant(laziness)(勉强型):最小匹配
x??、x*?、x+?、x{n,}? 是最小匹配,其实x{n,m}?和x{n }?有些多余。在 greediness 模式之后添加 ? 就成最小匹配。
在 reluctant 的模式下,只要匹配成功,就不再继续尝试匹配更大范围的内容
string test = "a<tr>aava </tr>abb "; string reg = "<.+?>"; system.out.println(test.replaceall(reg, "###"));
输出:a###aava ###abb
与 greediness 不同,reluctant 模式下匹配了两次内容
possessive(占有型):完全匹配
x?+、x*+、x++、x{n,}+ 是完全匹配,在 greediness 模式之后添加 + 就成完全匹配。
possessive 模式与 greediness 有一定的相似性,那就是都尽量匹配最大范围的内容,直到内容结束,但与 greediness 不同的是,完全匹配不再回退尝试匹配更小的范围。
string test = "a<tr>aava </tr>abb "; string reg = "<.++>"; string test2 = "<tr>"; string reg2 = "<tr>"; system.out.println(test.replaceall(reg, "###")); system.out.println(test2.replaceall(reg2, "###"));
输出:a<tr>aava </tr>abb