用ruby写了个替换字符串的程序

时间 2019-12-21

标签 ruby 写了替换字符串程序栏目 Ruby 繁體版

原文原文链接

在一个文件里有不少如下内容： html

<p style="display:none">此题选D。
....
....
....
</p>

而本人要实现的功能是将它替换成：正则表达式

<div style="display:none" class="sl_explain">此题选D。
.....
.....
.....
</div>

这个东西看起来有点简单，但本人整整花了半天才实现此功能，主要是好久没写RUBY程序了，因此对API比较陌生；其次是本人对正则表达式，尤为是ruby的正则表达式不太熟悉；最后，还由于一些细节考虑得不够。

要实现上述功能，能够分为两步，第一步是将 ruby

<p style="display:none">此题选D。
....
....
....
</p>

中的\n替换掉，即替换成：

<p style="display:none">此题选D。............</p>

这种形式，为何要替换换\n呢，由于在读文件是，须要一行一行读，因此有\n的话，这一行就读不完，那么在用正则表达式匹配时，天然会匹配不全。要实现替换掉并且只替换掉

<p style="display:none">此题选D。............</p>

内部的\n，须要一些限制，具体实现代码以下：

File.open("逻辑填空2.htm","w") do |test|

File.open("逻辑填空.htm",'r:gbk') do |file|
    file.each_line do | line|
	if(line.start_with?('<p style="display:none">') && !line.end_with?("</p>\n"))
	   line.gsub!(Regexp.new('\n'), '')
       end
	test.print line
    end
end
end

即将替换掉的内容放在新的一个文件“逻辑填空2.html”中（注意1，上面输出到文件时，使用的是print，而不是puts，否则它又会天然加上一个\n，那就白替换了；注意2，上面的end_with后面还加个\n，由于读取这行结尾时，还有个隐形的换行符\n；注意3，有时候<p style="display:none">前面会有空格，因此能够将start_with改为include?），而后再读取此文件，再经过正则表达式进行替换，将替换掉的内容又放在“test.html”中： spa

File.open("test.html","w") do |test|
File.open("逻辑填空2.htm",'r') do |file|
   file.each_line do | line|
      line.gsub!(Regexp.new('<p style="display:none">(.*)</p>'), '<div style="display:none" class="sl_explain">\1</div>')
      test.puts line
   end
end

end

这样，本人要实现的功能就达到了，另外，若是若是文件不是一行一行读取的，却是能够用多行匹配的方式来作：

Regexp.new('<p style="display:none">(.*)</p>',Regexp::MULTILINE)

惋惜，本人只想出了逐行读取的方法，因此多行匹配模式没用上。