Преобразовать ограниченное подмножество RTF в открытый текст с тегами форматирования HTML - PullRequest
1 голос
/ 03 ноября 2010

Я собираюсь взять выходные данные WPF RichTextBox, который заблокирован, чтобы разрешить только определенные команды форматирования (полужирный, подчеркнутый и курсив), и проанализировать его как открытый текст с тегами HTML, обозначающими форматирование.Это сделано для того, чтобы информацию о форматировании можно было собирать и анализировать с помощью интерфейса публикации Oracle.

Вся другая информация, такая как размеры шрифтов, цвета и т. Д., Не важна, поскольку она будет обрабатываться шаблоном публикации далеелиния.

В идеале у нас было бы что-то вроде следующего, удаляющее все остальные теги rtf:

This is <b>some bold text, with <i>this bit</i> italic as well</b>

Есть ли относительно простой способ сделать это?Я видел некоторые строки Regex, но они, кажется, всегда пропускают нежелательный материал RTF.Я не хочу использовать коммерческое решение на самом деле, так как это довольно маленькая проблема.Есть идеи?

1 Ответ

1 голос
/ 04 ноября 2010

Вы должны проанализировать RTF и заменить необходимые управляющие коды тегами HTML.Учитывая сложность RTF, я не думаю, что Regex будет достаточно.

...