Войти
Запомнить
Регистрация
PullRequest
Лента
Топ
Теги
Новая
Новая
cometta
 
16 декабря 2009
 
8
сканер получает внешний результат поиска по сайту
0
голосов
cometta
/
16 декабря 2009
Какую наилучшую практику и библиотеку я могу использовать для ввода текстового поля поиска на внешнем веб-сайте и получения результатов поиска?
Как использовать сайт с другим окном поиска и флажком и собирать результат?
Можно ли использовать Selenium для автоматизации этого?
Должен ли я использовать Heritrix или Nutch? Какой из них лучше? Я слышал, что Nutch поставляется с плагинами. Какой из них имеет большее сообщество?
Java
селен
веб-гусеничный
Nutch
Пожалуйста,
войдите
или
зарегистрируйтесь
чтобы ответить на этот вопрос.
1
Ответ
1
голос
Bozho
/
16 декабря 2009
вы можете использовать:
Selenium API
HtmlUnit
HTMLparser
и т.д.
Пожалуйста,
войдите
или
зарегистрируйтесь
что бы добавить комментарий.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
Похожие темы
Nutch 1.16 не находит ничего, кроме главной страницы
Использование Apache Solr для индексации данных Nutch
Очистка данных от Apache Nutch
Как выполнить отказоустойчивое добавочное сканирование с использованием Apache Nutch?
Преобразуйте одно поле в несколько полей в Solr
Solr не может выполнить поиск записей, просканированных по принципу натч, несмотря на то, что поля подписаны как indexed = true
Nutch 1.16 пропускает файл: / каталог в стиле ссылки в обход файловой системы
Развертывание локального эластичного поискового кластера на лазури
URL Apache Nutch в файле regex-urlfilter.txt
Натч с solr для индексации PDF по заданному URL
...