Я использую модуль win32com Python для нацеливания на таблицу Word .do c, а затем извлекаю из нее все предложения / ListParagraphs.
Я могу успешно получить весь свой контент, используя doc.Paragraphs
. Затем я пытаюсь запустить ..
РЕДАКТИРОВАНИЕ:
doc = word.Documents.Open(path)
list = doc.Paragraphs
for x in list:
if str(x.Style) == "Normal" and x != "":
# do stuff
это не обнаруживает пустые / пробельные списки и абзацы. Я также пытался использовать x.isspace()
для проверки пробелов, но он всегда возвращал False
.
Я уже пробежался с \r\n\t\x07\x0b
символами, которые, кажется, извлекаются в объектах класса COM. Они вызывают всевозможные странные проблемы при преобразовании их в строки. Может ли быть что-то похожее?
Спасибо