Извините, я не слишком уверен, что это за вопрос.- Если вы хотите получить веб-страницу из Java, а затем убрать html-данные, то это задача, которую вы можете довольно легко выполнить - или использовать что-то вроде Nutch.Если вы хотите запустить javascript внутри страницы внутри вашей java, вам нужно посмотреть на что-то вроде rhino.
nutch будет пауковать страницы и обновлять базу данных (обычно solr), после чего вы сможете выполнять поиск побазы данных и отображения результатов.