искать конкретный текст и конвертировать в ссылку - PullRequest
0 голосов
/ 14 декабря 2011

У меня есть куча HTML-файлов (5000).

Мои бизнес-требования определяют формат ссылки, скажем, это XXX-YY (Год) -ZZZ.

Я хочу заменить во всех html-файлах любое вхождение такого формата ссылкой, подобной этой:

<a href='~/app/document/XXX-YY(Year)-ZZZ'>XXX-YY(Year)-ZZZ</a>

Хотя это звучит «просто» с использованием стандартной замены регулярных выражений, на самом деле это сложнее, как я думал, поскольку процесс может выполняться несколько раз.

Мой текущий процесс будет "вкладывать" замены в что-то вроде этого:

<a href='~/app/document/<a href='~/app/document/XXX-YY(Year)-ZZZ>XXX-YY(Year)-ZZZ</a>><a href='~/app/document/XXX-YY(Year)-ZZZ>XXX-YY(Year)-ZZZ</a></a>

Как мне достичь своей цели?

PS: производительность не является проблемой (по крайней мере, когда она остается разумной)

1 Ответ

0 голосов
/ 14 декабря 2011

все, что вам нужно: HTML Agility Pack

отметьте это: c # html agility pack и множество других вопросов по этому поводу здесь, в SO; -)

это потому, что вам лучше использовать синтаксический анализатор с глубоким пониманием HTML-дерева, а не просто регулярное выражение или синтаксический анализ текста, который может завершиться неудачей в зависимости от конкретной разметки ...

...