Как преобразовать HTML в форматированный текст, чтобы макет, такой как интервалы, границы таблицы, расположение элементов, оставался нетронутым? - PullRequest
0 голосов
/ 30 мая 2019

Как преобразовать HTML в форматированный текст, чтобы макет, такой как интервалы, границы таблицы, расположение элементов, оставался нетронутым?Есть ли какой-нибудь инструмент для того же самого?

Попробовал несколько вариантов уже следующим образом, но форматирование вывода не соответствует желаемому:

  1. Преобразование TxtControl
  2. Преобразование PythonCom

Проблема: Преобразование таблицы HTML с интервалом между ячейками, в результате чего содержимое ячейки перемещается на следующую строку, что нарушает форматирование.Ожидаемый результат: содержимое ячейки строки таблицы должно быть в одной строке, а граница должна быть неповрежденной в текстовом файле.

Кроме того, преобразование PDF / RTF в TEXT также будет работать, только форматирование должно быть неповрежденным.

Прикрепление скриншотов для большей ясности по требованию. ВХОДНЫЙ ЭКРАННЫЙ СКРИНШОТ

ВЫХОДНОЙ ТЕКСТОВЫЙ СКРИНШОТ

В качестве альтернативы, есть ли способ прочитать символьный HTML и записать в текстовый файлчтобы макет не изменялся при выводе текста.

1 Ответ

0 голосов
/ 30 мая 2019

Это работает?

Вы можете конвертировать HTML в BBCode, и у вас есть редактор RTF.

http://www.ecardmax.com/hoteditor/

Просто установите флажок HTML, чтобы в него можно было вставить HTML. Поэтому, когда вы вставляете свой текст, вы выбираете часть HTML, вы должны попробовать оба варианта.

Вот результаты вашего поста в BBCode

Обратите внимание, что это моя отредактированная версия:

How to [B]convert[/B] HTML into formatted Text, so that the layout such as spacing, table borders, element positioning remains intact? Is there any tool for the same?
Tried a few options already as follows but output formatting is not as desired:
[LIST=1]
[*]TxtControl conversion
[*]PythonCom conversion[/LIST]
[B]Issue:[/B] Converting HTML table with spacing between cells resulting in cell content getting moved to next line hence disturbing the formatting.Expected output is : Table row cell content shall be in same line and border shall be intact in text file.
Also, PDF/RTF to TEXT conversion will also work just formatting should be intact.

Возможно, вам нужно что-то вручную удалить, например, мне пришлось удалить текст под названием «Спасибо за ваши изменения!» появляется, когда вы редактируете что-то, и оно все еще находится на рассмотрении.

Это полезно, если вы хотите конвертировать старые сообщения, к которым у вас больше нет доступа в XenForo.

Затем вы можете поместить его в текстовый заменитель, где он может заменить [B] на **

...