Как конвертировать между двумя типами разметки документов с помощью регулярных выражений в C #? - PullRequest
0 голосов
/ 03 августа 2009

Я пытаюсь преобразовать разметку в html-стиле, например, жирный и курсив в мой собственный формат разметки:

Жирное слово ---> * Жирное слово *

Таким образом, жирный тэг преобразуется в упаковку звезд и т. Д.

Какой самый простой / лучший / быстрый способ сделать это? Разбор строки вручную достаточно просто, но как насчет регулярных выражений?

Я использую C # .NET 3.5:)

Ответы [ 2 ]

2 голосов
/ 03 августа 2009

Если ваш HTML вообще сложен - вложенные теги, несовпадающие теги и т. Д. - я бы рекомендовал использовать HTML Agility Pack для его анализа. Если вы хотите использовать RegEx для этого, обязательно следите за блогом Джеффа - они используют RegEx для разбора HTML StackOverflow .

0 голосов
/ 03 августа 2009

Это должно сделать это:

s = Regex.Replace(s, "<b>(.*?)</b>", "*$1*");

до тех пор, пока внутри других жирных тегов нет ничего странного, как жирные метки.

...