Кажется, что содержимое URL-адреса OP изменилось, как это обычно происходит в Интернете, поэтому я собрал несколько примеров HTML-кода, чтобы показать, как мне поступить.
Кроме того, Nokogiri - это то, что я рекомендую как Ruby HTML / XML-парсер, потому что он очень активно поддерживается, надежен и гибок.
require 'nokogiri'
html = <<EOT
<html>
<body>
some<br><br>text
<font>
text wrapped with font
</font>
some<br>more<br>text
</body>
</html>
EOT
doc = Nokogiri::HTML(html)
# Replace all doubled-up <BR> tags with <P> tags, and remove fonts.
doc.search('br').each do |n|
if (n.previous.name == 'br')
n.previous.remove
n.replace('<p>')
end
end
doc.search('font').each do |n|
n.replace(n.content)
end
print doc.to_html
# >> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
# >> <html><body>
# >> some<p></p>text
# >>
# >> text wrapped with font
# >>
# >> some<br>more<br>text
# >> </body></html>