Как преобразовать HTML в Markdown, используя Nokogiri? - PullRequest
1 голос
/ 17 августа 2011

Есть ли способ преобразовать HTML в текст Markdown?

  • HTML довольно прост - это просто элемент div с несколькими <p> элементами внутри.
  • Там могут быть изображения - я тоже хочу их сохранить.
  • Также может быть несколько «встроенных» изображений, подобных этому: <img src='images/symbol_minus.gif' width='9' height='3' alt='&minus;' border='0' style='vertical-align:middle;' />, который является просто знаком минус - я хочу заменить их текстом.

Nokogiri::XML::Element#text - это почти то, что я хочу, но оно снимает изображения.

1 Ответ

3 голосов
/ 18 августа 2011

Как и предполагал @Konrads, здесь есть повторяющаяся запись здесь . Однако ссылка, приведенная в ответе на эту запись, не работает.

Я немного погуглил и обнаружил, что некоторые вилки выжили: https://github.com/tomkrush/reverse-markdown, https://gist.github.com/788039.

Если эти вилки станут мертвыми, просто Google для "обратной уценки". Вы обязательно найдете что-то живое и работающее.

...