Я пытаюсь прочитать файл docx с содержанием ниже, но некоторые слова не читаются:
Тетрагидрофуран AR класс
Ацетонитрил ВЭЖХ класс
Калий дигидроортофосфат AR класс *
Ортофосфорная кислота AR класс
Соляная кислота AR класс
document = Document('test.docx')
for para in document.paragraphs:
print(para.text)
Ожидаю получить все содержимое, но после извинения я не получаю 'Соляная кислота AR'
Выход будет следующим:
Тетрагидрофуран, класс AR
Ацетонитрил, ВЭЖХ, класс
Калия дигидроортофосфат, класс AR
Ортофосфорная кислота, класс AR
оценка
Я хочу, чтобы каждое слово выводилось