Я только что получил в руки Stackoverflow дамп данных , и я разочарован, увидев, что поле "Текст" сообщений находится в HTML, а не в Markdown. Я подозреваю, что в исходной базе данных есть Markdown, потому что именно это я вижу, если пытаюсь отредактировать ответ.
Я хочу восстановить Markdown из большого набора ответов. Я буду обрабатывать сотни записей в пакетном режиме, используя инструменты командной строки или какую-то библиотеку Lua или C, поэтому интерактивный инструмент, такой как wmd Markdown editor , не подходит. Могут ли люди сказать
Какие инструменты доступны, чтобы помочь мне восстановить Markdown из дампа данных Stackoverflow?
(Смежный вопрос, не дубликат: Преобразование HTML обратно в Markdown в wmd .)