Abhijeet вроде как на правильном пути, но я собираюсь потратить время, чтобы объяснить, как браузеры обрабатывают веб-страницы и помочь вам понять, почему ваш запрос такой сложный.
Предупреждение Это довольно грубо, и я выдумал некоторые детали для краткости и ясности
Браузер подключается к серверу и использует HTTP для получения запрошенной вами страницы.Когда эта страница загружена, браузер затем ищет любые дополнительные ресурсы, на которые есть ссылки на этой странице, и извлекает их.Затем он выполняет любой найденный JavaScript сверху вниз, включая любые сценарии, на которые ссылаются.Этот javascript может манипулировать страницей, но к этому моменту браузер не очень заботится об исходном исходном коде страницы, так как усвоил его как DOM или объектную модель документа.Javascript на самом деле просто манипулирует этим DOM, так как DOM - это просто древовидная структура, не выполняющая никаких манипуляций с исходным кодом.В результате firebug (или инспектор webkit) фактически не отображают исходный код, они отображают текущее состояние DOM.
Проблема с вашим запросом заключается в том, что вы хотите использоватьОтдельная система для загрузки URL, затем выполните весь вышеуказанный процесс, к сожалению, это потребует от вас реализации всего движка JavaScript в Java.
Однако, еще не все потеряно.HTMLUnit (упомянутый другими) - это работающий безголовый браузер, написанный на Java, и как таковой вы можете интегрировать его в свою программу.На самом деле выполнение этого выходит за рамки этого ответа, но домашняя страница здесь , а документация API здесь .