Непечатные символы в файле чтения слов в Python - PullRequest
0 голосов
/ 06 ноября 2019

Я читаю таблицу из файла Word. Ниже мой код для чтения файла слова:

  import win32com.client as win32


  word = win32.Dispatch("Word.Application")
  word.Visible = 0
  word.Documents.Open(SigLexiconFilePath)
  doc = word.ActiveDocument
  table = doc.Tables(1)

  for i in range(2 , table.Rows.Count+1):
    commandName = table.Cell(Row = i, Column= 0).Range.Text 

Все commandName имеют немецкие символы и 2 непечатаемых символа в конце строки. Например:

commandName = Prüf\r\x07

Я использовал приведенный ниже код для удаления непечатаемых символов, но он также удаляет немецкие символы из строки.

commandName = ''.join(filter(lambda x: x in string.printable, commandName))
commandName = commandName.strip()

IsЕсть ли питонический способ удалить ненужные символы из строки? Окончательный результат, который я хочу:

commandName = Prüf

1 Ответ

0 голосов
/ 06 ноября 2019

у меня работала эта простая строка:

commandName.split('\r')
...