Предположим, у меня есть весь HTML-код страницы результатов поиска Google. Кто-нибудь знает какой-либо существующий код (Ruby?) Для очистки / анализа первой страницы результатов поиска Google? В идеале он должен обрабатывать разделы «Результаты покупок» и «Результаты видео», которые могут появиться где угодно.
Если нет, то какой инструмент на основе Ruby лучше всего подходит для скраппинга?
Чтобы уточнить: я знаю, что трудно / невозможно получить результаты поиска Google программно / с помощью API И просто у страниц результатов CURLing много проблем. Здесь есть консенсус по обоим этим пунктам в стеке потока. У меня вопрос другой.