Может быть, регулярные выражения - не лучшее решение, но я уже использую как пять разных библиотек, и boost отлично справляется с поиском <a href>
тегов и ключевых слов.
Я использую эти регулярные выражения:
/<a[^\n]*/searched attribute/[^\n]*>[^\n]*</a>/
для поиска <a href>
тегов и:
/<a[^\n]*href[[^\n]*>/searched keyword/</a>/
для размещения ссылок
(КСТАТИ это можно сделать лучше? - я отстой в регулярное выражение;))
Теперь мне нужно найти теги, содержащие <a href>
, и я думаю, что регулярные выражения сделают все правильно - возможно, мне нужно написать свою собственную функцию синтаксического анализа, как сказал Петр.