Инструмент для определения семантической структуры веб-страницы, а не содержимого - PullRequest
2 голосов
/ 11 сентября 2009

Кто-нибудь знает какие-либо инструменты, позволяющие различать семантическую разметку между двумя веб-страницами, а не содержимое?

Приветствие.

Ответы [ 2 ]

0 голосов
/ 11 марта 2011

Вы можете попробовать использовать инструмент Pretty Diff. Это потребует незначительной настройки для компонента улучшения разметки, чтобы компоненты содержимого были установлены на пустые строки.

Посмотрите на http://prettydiff.com/markup_beauty.js

Измените строки 554, 557 и 560 на:
build.push ("знать текст");

Эти изменения действительно должны были бы произойти в более крупном prettydiff.com/prettydiff.js, но теперь вы знаете, где искать. После того, как вы закончите, вы можете запустить все это из вашего местного.

Все, что вам нужно, это:

  • HTML http://prettydiff.com/
  • prettydiff.com / diffview.css
  • prettydiff.com / pd.js - это интерфейс DOM между приложением и HTML
  • prettydiff.com / prettydiff.js - это фактический код приложения.

Я могу написать эту концепцию игнорирования контента в инструменте в качестве опции.

0 голосов
/ 11 сентября 2009

Нет, но вы можете добиться большего успеха, если разбить его на два этапа:

  1. Удалить содержимое
  2. Diff
...