Я не знаю ответа, кроме переключения типа страницы, а для XmlPage и SgmlPage нужно сделать innerHTML для элемента HTML и вручную выписать атрибуты. Не элегантный и точный (в нем отсутствует тип документа), но он работает.
Page.getWebResponse (). GetContentAsString ()
Это неверно, так как возвращает текстовую форму исходного не обработанного, без js байтов. Если javascript выполняется и меняет материал, то этот метод не увидит изменений.
page.asXml () вернет HTML. page.asText () возвращает его визуализацию в виде простого текста.
Просто хочу подтвердить, что это возвращает только текст внутри текстовых узлов и не включает теги и их атрибуты. Если вы хотите взять полный HTML-код, это не очень хорошая идея.