Есть ли другой способ сделать снимки экрана, кроме регулярных выражений? - PullRequest
1 голос
/ 17 сентября 2008

Я делаю персональный, просто для забавы, проект, который использует скребок экрана, чтобы дать мне уведомление в системном трее в случае добавления, изменения или удаления другой строки в таблице HTML.

Сделав это прежде, чем я подумал: хорошо, давайте продолжим с регулярным выражением, и все, но, будучи любопытным человеком, заставил меня подумать, что может быть что-то еще, что может иметь другую парадигму, но быть настолько простым в использовании .

Я знаю о DOM и X-Path и всех подходах xml'ish. Я ищу что-то нестандартное, что-то, что можно даже определить в наборе правил, чтобы вы могли создать систему плагинов для объединения различных сайтов.

Ответы [ 3 ]

3 голосов
/ 17 сентября 2008
0 голосов
/ 17 сентября 2008

Вот идея: если ваш основной сценарий использования заключается в получении уведомления при каждом изменении файла HTML, почему бы не использовать стандартный инструмент сравнения, а затем выполнить цикл по измененным строкам, применяя ваши правила?

Кроме того, если в такой ситуации у вас есть доступ к серверу и просматриваемым файлам, вы можете установить контроль над исходным кодом с помощью CVS (или аналогичного) и просто следить за коммитами. Если вы хотите использовать этот подход для случайных сайтов в Интернете, просто напишите сценарий, который периодически загружает HTML-код для соответствующих URL-адресов, а затем передает его в систему управления версиями и просматривает различия.

Не очень практично, но нестандартно.

0 голосов
/ 17 сентября 2008

Если вы можете преобразовать источник в действительный XHTML / XML, используя что-то вроде SgmlReader или HtmlTidy , тогда вы можете использовать XSLT. Просто создайте XSL-шаблон для каждого сайта, который хотите очистить.

...