Как конвертировать docx в markdown, как избавиться от подчеркивания span в ссылках? - PullRequest
0 голосов
/ 28 мая 2018

Со времени недавнего обновления pandoc (сейчас я на 2.2.1) ссылки в документе docx преобразуются в [<span class="underline">graphic novel hero</span>](https://www.amazon.com/exec/obidos/ASIN/1596432594/braipick-20), добавляя ненужный диапазон для меток ссылок.Есть ли какая-то черная магия (кроме добавления вызова sed в конвейер), чтобы избавиться от них и вернуться к чистому общему знаку?

Я использую следующие параметры pandoc: pandoc -f docx --atx-headers --wrap=none --extract-media=. -t commonmark-smart myFile.docx

Спасибо за разъяснения!

1 Ответ

0 голосов
/ 28 мая 2018

Если вы используете -t commonmark промежутки, которые генерирует docx-reader, преобразуются в необработанный HTML, так что вы можете использовать:

pandoc -t commonmarkd-raw_html

В качестве альтернативы, используйте markdown-writer, который более гибок вусловия продления (но по состоянию на 2018 год еще не на 100% совместимы с марками):

pandoc -t markdown-bracketed_spans-raw_html-native_spans

Подробнее см. РУКОВОДСТВО .

...