Я ничего не знаю как часть самого HtmlUnit, но это не сложно сделать самостоятельно.
Вытащите все зависимые ссылки самостоятельно - например, используйте getByXPath()
, чтобы получить все <a>
теги - и итерируйте их и заставьте HtmlUnit извлекать каждый из них по отдельности.
Просто будьте осторожны, используя это для определения времени загрузки: если вы не будете эмулировать, как "настоящий" браузер будет получать вещи параллельно, вы не получитеточная мера.Такой инструмент, как Xenu , был бы лучшим инструментом для этой работы.