Парсер может это сделать, но это будет излишним, если у вас есть простой HTML для представления.Что-то вроде Loofah или sanitize может удалить все теги с помощью Nokogiri для анализа HTML, а затем удалить теги, оставив вас с текстом.
require 'sanitize'
html = '<html><body>Jackdaws love my giant sphinx of quartz.</body></html>'
puts Sanitize.clean(html)
# >> Jackdaws love my giant sphinx of quartz.
IЯ думаю, что люфа более способна, чем дезинфекция, но если все, что вы хотите сделать, это отбросить метки, то дезинфекция может быть лучшим способом.