Я пытаюсь санировать файл HTML, и он работает неправильно. Я хочу, чтобы все были полностью простым текстом, кроме тегов абзаца и разрыва строки. Вот мой код очистки (точки указывают на другой код в моем классе, который не имеет отношения к проблеме):
.
.
.
include ActionView::Helpers::SanitizeHelper
.
.
.
def remove_html(html_content)
sanitized_content_1 = sanitize(html_content, :tags => %w(p br))
sanitized_content_2 = Nokogiri::HTML(sanitized_content_1)
sanitized_content_2.css("style","script").remove
return sanitized_content_2
end
Это не работает правильно. Вот исходный HTML-файл , из которого функция читает свои входные данные, а - это "очищенный" код, который она возвращает . Он остается в теле тегов CSS, JavaScript и тегов комментариев HTML. Это может быть и в других вещах, которые я не заметил. Посоветуйте, пожалуйста, как полностью удалить все CSS, HTML и JavaScript, кроме тегов абзаца и разрыва строки?