Необходимо сравнить 2 HTML-документов с использованием Java и селена - PullRequest
2 голосов
/ 14 июля 2010

Мне нужно проверить различия между двумя html-страницами: одна - старая версия, а другая - обновленная страница.

Мне нужен Selenium, чтобы получить источник двух страниц, а затем сравнить их для проверки.различия.

Как мне добиться этого с помощью Java & Selenium?

Ниже приведен поток, который у меня есть:

  • Перейти на старую страницу с помощью Selenium
  • Собрать все данные для старой веб-страницы
  • Преобразовать данные в стандартный формат (возможно, XML);создайте для этого класс
  • Сохраните данные в файл
  • Перейдите на новую страницу с помощью Selenium
  • Соберите все данные для новой веб-страницы
  • Преобразование данных в стандартный формат (возможно, XML);используйте созданный вами класс для этого
  • Сохраните данные в файл
  • Используйте библиотеку Java для сравнения двух файлов

Может кто-нибудь дать идеи / примерыв том, как это реализовать?

1 Ответ

2 голосов
/ 29 июля 2010

Используйте selenium.getHtmlSource () для каждой страницы и либо сравнивайте возвращенные строки в Java, либо сохраняйте их в файлы и используйте инструмент командной строки, такой как «diff».

При использовании Java два метода IМожно подумать, что вы используете что-то вроде StringUtils.difference () (почти наверняка беспорядок) или еще лучше Google Diff .В Google diff есть библиотека Java и тестовый пример.

Конечно, их выходные данные будут буквально различаться, возможно, вы захотите что-то более нестандартное, чтобы иметь смысл изменений в HTML.

...