.NET 正则表达式使用高级技巧之替换类介绍
程序员文章站
2022-04-16 13:09:16
\d表示什么,{,5}表示什么,\[表示什么……,这里我只想提醒大家一点,为了避免和反向引用相冲突,在你用\nn表示八进制的ascii码时,请在\后加0,就是说,\40在表...
\d表示什么,{,5}表示什么,\[表示什么……,这里我只想提醒大家一点,为了避免和反向引用相冲突,在你用\nn表示八进制的ascii码时,请在\后加0,就是说,\40在表示ascii码时,请这样写\040。
public static void main()
{
string s = "1 12 3 5";
s = regex.replace(s,@"\d+",new matchevaluator(correctstring),regexoptions.compiled|regexoptions.ignorecase);
console.writeline(s);
console.readline();
}
private static string correctstring(match match)
{
string matchvalue = match.value;
if(matchvalue.length == 1)
matchvalue = "0" + matchvalue;
return matchvalue;
}
后面的选项,大家自己写个例子体味一下。
*注,上例中的(?#这个是注释)说明了正则的内联注释语法为(?#)
表达项选项
正则表达式选项regexoptions有如下一下选项,详细说明请参考联机帮助
这里我提到内联标志,是因为相对于用regexoptions在new regex时定义regex表达式的全局选项来说,内联标志可以更小粒度(以组为单位)的定义匹配选项,从而更方便表达我们的思想
替换
regex类有一个静态的replace方法,其实例也有一个replace方法,这个方法很强大,因为它可以传入一个delegate,这样,你可以自定义每次捕获匹配时,如何处理捕获的内容。
以上这段代码说明了如果使用delegate matchevaluator 来处理正则的match结果,该代码返回"01 12 03 05"。replace方法除了使用delegate来处理捕获的match,还可以用字符串来替换match的结果,而用字符串来替换match结果除了把match结果静态的替换成一个固定的文本外,还可以使用以下语法来更方便的实现你需要的功能:
复制代码 代码如下:
public static void main()
{
string s = "1 12 3 5";
s = regex.replace(s,@"\d+",new matchevaluator(correctstring),regexoptions.compiled|regexoptions.ignorecase);
console.writeline(s);
console.readline();
}
private static string correctstring(match match)
{
string matchvalue = match.value;
if(matchvalue.length == 1)
matchvalue = "0" + matchvalue;
return matchvalue;
}
$number |
把匹配的第number组替换成替换表达式,还有这句话怎么写也表达不清楚意思,还是来个例子吧: public static void main() 这段代码返回的是 “01 012 03 05” |
${name} | 把匹配的组名为"name"的组替换成表达式, 上例的regex expression改成@"(?<name>\d+)(?#这个是注释)"后面的替换式改为"0${name}"结果是一样的 |
$$ | 做$的转义符,如上例表达式改成@"(?<name>\d+)(?#这个是注释)"和"$$${name}",则结果为"$1 $12 $3 $5" |
$& | 替换整个匹配 |
$` | 替换匹配前的字符 |
$' | 替换匹配后的字符 |
$+ | 替换最后匹配的组 |
$_ | 替换整个字符串 |
后面的选项,大家自己写个例子体味一下。
*注,上例中的(?#这个是注释)说明了正则的内联注释语法为(?#)
表达项选项
正则表达式选项regexoptions有如下一下选项,详细说明请参考联机帮助
regexoptions枚举值 | 内联标志 | 简单说明 |
explicitcapture | n | 只有定义了命名或编号的组才捕获 |
ignorecase | i | 不区分大小写 |
ignorepatternwhitespace | x | 消除模式中的非转义空白并启用由 # 标记的注释。 |
multiline | m | 多行模式,其原理是修改了^和$的含义 |
singleline | s | 单行模式,和multiline相对应 |
这里我提到内联标志,是因为相对于用regexoptions在new regex时定义regex表达式的全局选项来说,内联标志可以更小粒度(以组为单位)的定义匹配选项,从而更方便表达我们的思想
语法是这样的:(?i:expression)为定义一个选项,(?-i:expression)为删除一个选项,(?i-s:expression)则定义i,删除s,是的,我们可以一次定义很多个选项。这样,通过内联选项,你就可以在一个regex中定义一个组为匹分大小写的,一个组不匹分大小写的,是不是很方便呢?
上一篇: 双系统的日子结束了:Windows和Linux将合二为一
下一篇: 别让他们跑了