Я ищу прощающий анализатор HTML для очистки HTML и извлечения данных в Ruby. Я успешно использовал BeautifulSoup для этого - что такое рубиновый эквивалент?
Nokogiri
Также см .: Nokogiri vs Hpricot , прежде чем сделать выбор. Nokogiri, кажется, превосходит hpricot в плане производительности (не тестировал себя) и имеет хороший синтаксис IMO.
Был драгоценный камень Rubyful Soup , который был Ruby-портом BeautifulSoup, но он больше не поддерживается, и их сайт теперь рекомендует hpricot .