Я использую веб-сбор (http://web -harvest.sourceforge.net /), инструмент для поиска веб-страниц с открытым исходным кодом.
Регулярное выражение, которое я пытаюсь использовать, содержит символы "<", ">" (потому что я пытаюсь удалить все входящие теги HTML). Это вызывает проблему, поскольку содержимое элементов должно состоять из правильно сформированных символьных данных или разметки.
Мне нужно как-то избежать выражения, но не могу понять, как.
Есть идеи?