Я занимаюсь извлечением информации, и мне нужен инструмент для сканирования данных из Интернета. страница, есть ли популярный в Windows?
От: http://en.wikipedia.org/wiki/Web_crawler:
И немного прочтения: Spidering Hacks 100 Советы и инструменты по промышленной прочности :
Созданный для разработчиков, исследователей, технических помощников, библиотекарей и опытных пользователей, Spidering Hacks предлагает экспертные советы по методикам паутинга и очистки. Вы начнете с ускоренного курса по паутинговым концепциям, инструментам (Perl, LWP, готовые утилиты) и этике (как узнать, когда вы зашли слишком далеко: что является приемлемым и неприемлемым). Далее вы будете собирать медиафайлы и данные из баз данных. Затем вы узнаете, как интерпретировать и понимать данные, переназначать их для использования в других приложениях и даже создавать авторизованные интерфейсы для интеграции данных в ваш собственный контент.