Я читаю таблицу из файла Word. Ниже мой код для чтения файла слова:
import win32com.client as win32
word = win32.Dispatch("Word.Application")
word.Visible = 0
word.Documents.Open(SigLexiconFilePath)
doc = word.ActiveDocument
table = doc.Tables(1)
for i in range(2 , table.Rows.Count+1):
commandName = table.Cell(Row = i, Column= 0).Range.Text
Все commandName
имеют немецкие символы и 2 непечатаемых символа в конце строки. Например:
commandName = Prüf\r\x07
Я использовал приведенный ниже код для удаления непечатаемых символов, но он также удаляет немецкие символы из строки.
commandName = ''.join(filter(lambda x: x in string.printable, commandName))
commandName = commandName.strip()
IsЕсть ли питонический способ удалить ненужные символы из строки? Окончательный результат, который я хочу:
commandName = Prüf