Я искал библиотеки XML и HTML на rubyforge для простого способа извлечения данных из веб-страницы. Например, если я хочу проанализировать пользовательскую страницу в stackoverflow, как я могу получить данные в пригодном для использования формате?
Скажем, я хочу проанализировать собственную страницу пользователя для моей текущей оценки репутации и списка значков. Я попытался преобразовать исходный код, полученный с моей страницы пользователя, в xml, но преобразование не удалось из-за отсутствия div. Я знаю, что мог бы сравнить строки и найти искомый текст, но должен быть гораздо лучший способ сделать это.
Я хочу включить это в простой скрипт, который выкладывает мои пользовательские данные в командной строке и, возможно, расширить его в приложение с графическим интерфейсом.