Я хочу конвертировать doc / docx файлы в текстовые файлы. Мое требование заключается в том, что таблицы должны быть как есть.
Я пробовал Python Tika. Преобразование строк в столбцы
Например, таблица во входном файле doc / docx
Над таблицей преобразуется в текст, подобныйниже
LANGUAGE
UNDERSTAND
LEARN
HINDI
YES
NO
MARATHI
YES
NO
ENGLISH
YES
NO
Требуемый вывод похож (сохранить формат таблицы)
LANGUAGE UNDERSTAND LEARN
HINDI YES NO
MARATHI YES NO
ENGLISH YES NO
Пожалуйста, дайте мне знать, если это возможно.