Java-сокет для чтения содержимого веб-страницы - PullRequest
0 голосов
/ 27 апреля 2010

Можно ли использовать API сокетов Java для чтения содержимого веб-страницы, например: "www.yahoo.com"? Может кто-нибудь здесь показать пример?

А как насчет чтения содержимого страницы, защищенной экраном входа в веб-приложение?

Спасибо заранее, дара кок

Ответы [ 2 ]

3 голосов
/ 27 апреля 2010

Это возможно, но не рекомендуется. Веб-страница возвращается с использованием HTTP, который представляет собой не просто поток байтов. Это означает, что для использования сокета ваше приложение должно понимать инструкции в ответах HTTP и вести себя соответствующим образом.

Для программного доступа к веб-странице используйте Jakarta Commons HTTP Client .

Что касается защищенных веб-страниц, это будет зависеть от того, как они защищены, однако, учитывая, что HTTP-клиент может поддерживать файлы cookie, вы также сможете выполнять вход в систему с помощью кода.

1 голос
/ 27 апреля 2010

В дополнение к ответу Ника (т. Е. Используйте HTTP-клиент Jakarta commons). Безопасность входа в систему зависит от того, как реализована страница входа в систему. Если это защищенный сайт Apache .htaccess, вам нужно будет указать имя пользователя и пароль в заголовке запроса. В качестве альтернативы (и, как правило, более обычно), если это HTML-форма, вам нужно будет деконструировать поля формы из исходного HTML и отправить их в качестве параметров ключ / значение в запросе http GET / POST

...