Поиск файлов HTML с использованием Regex - PullRequest
0 голосов
/ 03 апреля 2011

У меня есть пул HTML-файлов, и я хочу найти в них тот же целевой текст.Требуется выполнять поиск по их текстовому содержимому только при игнорировании всех тегов html, заголовка, сценария и т. Д.

Я пробовал QRegExp, класс регулярных выражений в Qt, но не смог найти хороший шаблон для выполнения того, что ям после.

Буду признателен за любую помощь в этом отношении.

Спасибо.

1 Ответ

0 голосов
/ 03 апреля 2011

Это может или не может быть хорошим ответом для вас, но рассматривали ли вы вместо этого использование DOM-парсер?Это устранит необходимость отфильтровывать текст и разметку HTML.К сожалению, я не могу рекомендовать хороший для C ++.

...