Я хочу удалить все изображения со страницы HTML (фактически, пользовательский ввод), которые не соответствуют определенным критериям (class = "int" или class = "ext"), и я борюсь с правильным подходом. Вот что я делаю до сих пор:
hbody = Hpricot(input)
@internal_images = hbody.search("//img[@class='int']")
@external_images = hbody.search("//img[@class='ext']")
Но я не знаю, как найти изображения, в которых класс имеет неправильное значение (не «int» или «ext»).
Мне также нужно перебрать элементы, чтобы проверить другие атрибуты, которые не являются стандартными html (я использую их для установки внутренних значений, таких как идентификатор БД, который я установил в атрибуте dbsrc). Могу ли я получить доступ к этим атрибутам и есть ли способ удалить определенные элементы (которые есть в результате поиска hpricot), если они не соответствуют моим критериям?
Спасибо за вашу помощь!