Альтернатива HtmlUnit - PullRequest
       65

Альтернатива HtmlUnit

20 голосов
/ 23 ноября 2010

Я изучал доступные на сегодняшний день безголовые браузеры и обнаружил, что HtmlUnit используется довольно широко.Есть ли у нас альтернатива HtmlUnit с возможным преимуществом по сравнению с HtmlUnit?

Спасибо, Найн

Ответы [ 6 ]

7 голосов
/ 23 ноября 2010

Насколько я знаю, HtmlUnit` - самый мощный браузер без головы.

Какие у вас проблемы с ним?

5 голосов
/ 13 ноября 2012

Есть много других библиотек, которые вы можете использовать для этого.

  • Если вам нужно очистить базу данных XML, используйте JTidy .
  • Если вам нужно очистить определенные данные из HTML, вы можете использовать Jsoup .

Ну, я использую jsoup - он работает намного быстрее, чем любой другой API.

4 голосов
/ 23 ноября 2010

WebDriver с виртуальным кадровым буфером является единственной реальной альтернативой.Преимущество в том, что он использует настоящий браузер;недостаток в том, что настраивать его труднее, а API гораздо беднее.

3 голосов
/ 30 ноября 2010

Я собираюсь использовать Selenium для моего варианта использования, поскольку он предлагает мне использовать настоящий браузер и не отклоняться от того, что он будет отображать в реальном мире, по сравнению с HtmlUnit. Я планирую использовать Selenium2, который имеет интеграцию с WebDriver и предлагает отличный API и классные исправления. Спасибо Найн

2 голосов
/ 17 августа 2011

Я бы также порекомендовал Selenium.Отличной особенностью является то, что вы можете создать клиент, который открывает страницу браузера, чтобы вы могли видеть, что происходит на каждом этапе.Более того, создание макросов для автоматизированных тестов - еще одна полезная функция.Однако, если вам нужно удалить некоторую информацию с веб-страницы, HtmlUnit лучше, чем селен.

2 голосов
/ 30 ноября 2010

Я использую webkit в качестве автономного браузера через привязки Qt Python: http://www.riverbankcomputing.co.uk/static/Docs/PyQt4/html/qtwebkit.html

Webkit - это механизм рендеринга, используемый Chrome и Safari, и очень гибкий.

Один из моихПричиной его выбора вместо HtmlUnit была простота настройки:

sudo apt-get install python-qt4
...