Мы столкнулись с проблемой при разборе писем с python из Outlook. Иногда в электронных письмах есть символы, которые нельзя добавить на лист Excel с помощью openpyxl. Ошибка, которую он вызывает, - это просто IllegalCharacterError
.
Я пытаюсь заставить это распечатать фактические символы, которые считаются «незаконными».
Это сказано, пока вы копались в одном из файлы в opnepyxl, которые я нашел на cell.py
, эта строка вызывает ошибку.
if next(ILLEGAL_CHARACTERS_RE.finditer(value), None):
raise IllegalCharacterError
Итак, переходя туда, где определено ILLEGAL_CHARACTERS_RE
, мы находим:
ILLEGAL_CHARACTERS_RE = re.compile(r'[\000-\010]|[\013-\014]|[\016-\037]')
Итак, я попробовал на print(ILLEGAL_CHARACTERS_RE)
в надежде, что он может распечатать значения, которые он представляет. Поскольку я не очень разбираюсь в регулярных выражениях или использовании компиляции, я не был уверен, что произойдет, но, к сожалению, все, что я распечатал на консоли, было re.compile(r'[\000-\010]|[\013-\014]|[\016-\037]')
.
Может ли кто-нибудь помочь мне выяснить, как их распечатать значения или, по крайней мере, понять, как найти, что эти значения представляют?