欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Ruby编写HTML脚本替换小程序的实例分享

程序员文章站 2022-06-28 23:32:17
在一个文件里有很多以下内容:

此题选d。 .... .... ....

...

在一个文件里有很多以下内容:

<p style="display:none">此题选d。
....
....
....
</p>

而本人要实现的功能是将它替换成:

<div style="display:none" class="sl_explain">此题选d。
.....
.....
.....
</div>

这个东西看起来有点简单,但本人整整花了半天才实现此功能,主要是很久没写ruby程序了,所以对api比较陌生;其次是本人对正则表达式,尤其是ruby的正则表达式不太熟悉;最后,还因为一些细节考虑得不够。
要实现上述功能,可以分为两步,第一步是将

<p style="display:none">此题选d。
....
....
....
</p>

中的\n替换掉,即替换成:

<p style="display:none">此题选d。............</p>

这种形式,为什么要替换换\n呢,因为在读文件是,需要一行一行读,所以有\n的话,这一行就读不完,那么在用正则表达式匹配时,自然会匹配不全。要实现替换掉而且只替换掉

<p style="display:none">此题选d。............</p>

内部的\n,需要一些限制,具体实现代码如下:
file.open("逻辑填空2.htm","w") do |test|

file.open("逻辑填空.htm",'r:gbk') do |file|
 file.each_line do | line|
 if(line.start_with?('<p style="display:none">') && !line.end_with?("</p>\n"))
  line.gsub!(regexp.new('\n'), '')
  end
 test.print line
 end
end
end

即将替换掉的内容放在新的一个文件“逻辑填空2.html”中(注意1,上面输出到文件时,使用的是print,而不是puts,不然它又会自然加上一个\n,那就白替换了;注意2,上面的end_with后面还加个\n,因为读取这行结尾时,还有个隐形的换行符\n;注意3,有时候<p style="display:none">前面会有空格,所以可以将start_with改成include?),然后再读取此文件,再通过正则表达式进行替换,将替换掉的内容又放在“test.html”中:

file.open("test.html","w") do |test|
file.open("逻辑填空2.htm",'r') do |file|
 file.each_line do | line|
  line.gsub!(regexp.new('<p style="display:none">(.*)</p>'), '<div style="display:none" class="sl_explain">\1</div>')
  test.puts line
 end
end

end

这样,本人要实现的功能就达到了,另外,如果如果文件不是一行一行读取的,倒是可以用多行匹配的方式来做:

regexp.new('<p style="display:none">(.*)</p>',regexp::multiline)

可惜,本人只想出了逐行读取的方法,所以多行匹配模式没用上。

相关标签: Ruby HTML