Ваша проблема может быть разбита на
- войти на сайт
- Скопируйте данные с сайта.
Итак, для первой части -:
Установите LiveHTTP заголовок аддона Firefox, а затем прочитайте все http
заголовки, которые были отправлены и получены вашим браузером при попытке
Войти.
Попробуйте отправить эти заголовки, используя ваш код Java, в основном у вас есть
эмулировать HTTP POST
запрос, используя ваш код Java. Для этого
google->make post request from java
После того, как вы войдете в систему на веб-сайте, удалите данные, используя API по вашему выбору.
Я лично использую htmlcleaner
HtmlCleaner .
Для очистки данных вы можете использовать XPath expressions
с htmlcleaner.
Взгляните на Xpath + htmlcleaner и здесь также
Вы также можете использовать JSoup
вместо htmlcleaner
. Преимущество использования JSoup в том, что он может обрабатывать как login[POST Request] and Data scraping
. Взгляните сюда http://pastebin.com/E0WzpuhF
Я знаю, что это кажется большой работой, я предоставил вам два альтернативных решения для вашей проблемы, но разделите вашу проблему на более мелкие куски и затем попытайтесь ее решить.