MarkdownSharp / Markdown.NET: Как получить неформатированный текст из уценки? - PullRequest
4 голосов
/ 17 января 2010

Иногда бывает полезно преобразовать уценку в чистый текст (например, для отправки по электронной почте).

Поддерживает ли какая-либо из этих библиотек эту функцию? (На самом деле я больше заинтересован в MarkdownSharp)

EDIT

Ответ на комментарий Йорна. Я уточню, что я ожидаю от такого преобразования:
У Markdown есть специальные символы, которые, в зависимости от контекста, имеют только значение форматирования. Например, символы **, =, -. Было бы хорошо, если бы я мог очистить текст от символов форматирования.

Я не уверен, что будет лучшим подходом и какие символы должны быть удалены, например, я не знаю, что делать со ссылками, но я думаю, что кто-то мог что-то сделать в этом смысле раньше.

РЕДАКТИРОВАТЬ 2

Найден хороший пример: Stackoverflow использует этот тип очистки уценки в списке «Вопросы». Я вполне уверен, что он очищает форматирование уценки перед тем, как сделать краткое содержание вопроса, иначе он будет содержать разрывы строк, сильные стороны, H1 и т. Д.

РЕДАКТИРОВАТЬ 3

Я согласен с Джоном. Лучшее решение, кажется, состоит в том, чтобы преобразовать уценку в HTML и затем удалить полученный HTML.

И эта задача, кажется, уже решена: Как я могу удалить HTML из текста в .NET?

1 Ответ

2 голосов
/ 17 января 2010

Если вы просто хотите сохранить оригинальный текст, просто не передавайте его Markdown.

Markdown предназначен только для одного: превращение текста в формате Markdown в HTML. Если вы хотите, чтобы Markdown форматировал его в формате, отличном от HTML, с другим набором правил преобразования, то, увы, вам придется написать свой собственный преобразователь.

Если вы хотите получить «только текстовую» версию уже отформатированной HTML-разметки, вы можете просто удалить теги HTML. Это то, что делает StackOverflow.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...