Вызов скрипта с определенного URL в Java? - PullRequest
0 голосов
/ 29 марта 2012

Я использую Java для разбора HTML со случайного веб-сайта, скажем, для удобства это http://google.com.После анализа данных HTML я хочу извлечь некоторые из этих данных и отобразить их на дисплее.После этого пользователь получит возможность ввести поисковый запрос и нажать кнопку.Эта кнопка выполнит этот скрипт за кнопкой «поиск».Я хочу сделать это с несколькими сайтами, поэтому предоставление мне способа, который работает только с Google, мне не очень поможет.

Ответы [ 2 ]

0 голосов
/ 29 марта 2012

Извините, я не слишком уверен, что это за вопрос.- Если вы хотите получить веб-страницу из Java, а затем убрать html-данные, то это задача, которую вы можете довольно легко выполнить - или использовать что-то вроде Nutch.Если вы хотите запустить javascript внутри страницы внутри вашей java, вам нужно посмотреть на что-то вроде rhino.

nutch будет пауковать страницы и обновлять базу данных (обычно solr), после чего вы сможете выполнять поиск побазы данных и отображения результатов.

0 голосов
/ 29 марта 2012

Редактировать:

А, понятно.Вы спрашиваете, как вызвать удаленную веб-страницу из вашего кода?Это можно сделать несколькими способами:


Очистка веб-сайтовсложная проблема, и редко я обнаружил, что один скребок может обрабатывать несколько веб-сайтов.Идея универсального скребка просто невозможна.

Я бы порекомендовал написать Java interface, что-то вроде HandleSearchPage.Он будет содержать метод для удаления страницы и извлечения некоторых данных, а также другой метод для отправки поиска.

Затем вы можете реализовать свои скребки для Google, Yahoo и т. Д. Что касается анализа html ина веб-странице есть много других вопросов / ответов по этой конкретной теме.

Удачи.

...