Как написать гусеничный на ruby? - PullRequest
0 голосов
/ 21 февраля 2012

Я работаю над приложением ROR, где мне нужно реализовать сканер, который сканирует другие сайты и сохраняет данные в моей базе данных. Например, предположим, что я хочу отсканировать все сделки с http://www.snapdeal.com и сохранить их в моей базе данных. Как реализовать это с помощью сканера?

Ответы [ 3 ]

9 голосов
/ 21 февраля 2012

Есть несколько вариантов в зависимости от вашего варианта использования.

Я использовал комбинацию Nokogiri и Mechanize для нескольких своих проектов, и я думаю, что они хорошие варианты.

3 голосов
/ 21 февраля 2012

Вы хотите взглянуть на механизировать .Кроме того, из того, что вы упомянули, вы, вероятно, вообще не нуждаетесь в рельсах.

0 голосов
/ 21 февраля 2012

Как прокомментировал Серхио, вы извлекаете страницы, анализируете их и переходите по их ссылкам.В вашем случае это звучит так, как будто вы больше сосредоточены на «очистке экрана», чем на сканировании сетей с глубокими связями, поэтому такая библиотека, как Scrubyt , будет полезна (хотя прогресс в этой области уже иссяк).Вы также можете использовать низкоуровневую библиотеку, ориентированную на синтаксический анализ, например Nokogiri .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...