在一个文件里有不少如下内容: html
<p style="display:none">此题选D。 .... .... .... </p>
而本人要实现的功能是将它替换成: 正则表达式
<div style="display:none" class="sl_explain">此题选D。 ..... ..... ..... </div>这个东西看起来有点简单,但本人整整花了半天才实现此功能,主要是好久没写RUBY程序了,因此对API比较陌生;其次是本人对正则表达式,尤为是ruby的正则表达式不太熟悉;最后,还由于一些细节考虑得不够。
要实现上述功能,能够分为两步,第一步是将 ruby
<p style="display:none">此题选D。 .... .... .... </p>中的\n替换掉,即替换成:
<p style="display:none">此题选D。............</p>这种形式,为何要替换换\n呢,由于在读文件是,须要一行一行读,因此有\n的话,这一行就读不完,那么在用正则表达式匹配时,天然会匹配不全。要实现替换掉并且只替换掉
<p style="display:none">此题选D。............</p>内部的\n,须要一些限制,具体实现代码以下:
File.open("逻辑填空2.htm","w") do |test| File.open("逻辑填空.htm",'r:gbk') do |file| file.each_line do | line| if(line.start_with?('<p style="display:none">') && !line.end_with?("</p>\n")) line.gsub!(Regexp.new('\n'), '') end test.print line end end end
即将替换掉的内容放在新的一个文件“逻辑填空2.html”中(注意1,上面输出到文件时,使用的是print,而不是puts,否则它又会天然加上一个\n,那就白替换了;注意2,上面的end_with后面还加个\n,由于读取这行结尾时,还有个隐形的换行符\n;注意3,有时候<p style="display:none">前面会有空格,因此能够将start_with改为include?),而后再读取此文件,再经过正则表达式进行替换,将替换掉的内容又放在“test.html”中: spa
File.open("test.html","w") do |test| File.open("逻辑填空2.htm",'r') do |file| file.each_line do | line| line.gsub!(Regexp.new('<p style="display:none">(.*)</p>'), '<div style="display:none" class="sl_explain">\1</div>') test.puts line end end end这样,本人要实现的功能就达到了,另外,若是若是文件不是一行一行读取的,却是能够用多行匹配的方式来作:
Regexp.new('<p style="display:none">(.*)</p>',Regexp::MULTILINE)惋惜,本人只想出了逐行读取的方法,因此多行匹配模式没用上。