浅析Ruby中的正则表达式的使用

程序员文章站 2022-04-09 20:14:34

如果只是需要中查找字符串的 text, 不要使用正则表达式：string['text'] ...

如果只是需要中查找字符串的 text, 不要使用正则表达式：string['text']

针对简单的结构, 你可以直接使用string[/re/]的方式来查询.

  match = string[/regexp/]       # get content of matched regexp
  first_group = string[/text(grp)/, 1] # get content of captured group
  string[/text (grp)/, 1] = 'replace' # string => 'text replace'

当你不需要替结果分组时，使用非分组的群组。

  /(first|second)/  # bad
  /(?:first|second)/ # good

不要使用 perl 遗风的变量来表示匹配的正则分组（如 $1，$2 等），使用 regexp.last_match[n] 作为替代。

  /(regexp)/ =~ string
  ...

  # bad
  process $1

  # good
  process regexp.last_match[1]

避免使用数字化命名分组很难明白他们代表的意思。命名群组来替代。

  # bad
  /(regexp)/ =~ string
  ...
  process regexp.last_match[1]

  # good
  /(?<meaningful_var>regexp)/ =~ string
  ...
  process meaningful_var

字符类有以下几个特殊关键字值得注意: ^, -, \, ], 所以, 不要转义 . 或者 [] 中的括号。

注意, ^ 和 $ , 他们匹配行首和行尾, 而不是一个字符串的结尾, 如果你想匹配整个字符串, 用 \a 和 \z。

  string = "some injection\nusername"
  string[/^username$/]  # matches
  string[/\ausername\z/] # don't match

针对复杂的正则表达式，使用 x 修饰符。可提高可读性并可以加入有用的注释。只是要注意空白字符会被忽略。

  regexp = %r{
   start     # some text
   \s      # white space char
   (group)    # first group
   (?:alt1|alt2) # some alternation
   end
  }x

sub/gsub 也支持哈希以及代码块形式语法, 可用于复杂情形下的替换操作.

上一篇： Ruby中的字符串编写示例

下一篇： RabbitMQ基础入门篇

浅析Ruby中的正则表达式的使用

关于Javascript中document.cookie的使用

JavaScript中的 attribute 和 jQuery中的 attr 方法浅析

在Django中同时使用多个配置文件的方法

c#中虚函数的相关使用方法

详解Python的Django框架中Manager方法的使用

Android系统开发中log的使用方法及简单的原理

Django框架中的对象列表视图使用示例

详解Python的Django框架中inclusion_tag的使用

html5在android中的使用问题及技巧解读

iOS中的NSTimer定时器的初步使用解析