Комплексный поиск веб-документа - PullRequest
1 голос
/ 12 сентября 2010

Мне нужно получить документ с веб-сайта и проанализировать его. Проблема в том, что:

  1. Сайт использует протокол http и https
  2. Вам необходимо авторизоваться на сайте (у меня обычный аккаунт)
  3. На странице входа есть как минимум 2 перенаправления, чтобы войти в себя

Я управлял HTTPS-соединением и опубликовал свой логин и пароль, но у меня проблемы с управлением cookie и перенаправлением ....

Ответы [ 2 ]

1 голос
/ 12 сентября 2010

commons-httpclient поможет.

0 голосов
/ 12 сентября 2010

Использование библиотеки типа HtmlUnit , вероятно, поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...