У меня есть некоторый код на Python3 для поиска слов, возможно, с использованием встроенных #, -, апострофов или некоторых международных символов в тексте на английском языке:
>>> import re
>>> exp
"((?:[\\w#éüöêåo]+[-’'])*[\\w#éüöêåo]+)"
>>> line
'William Shakespea#e was an Englis# poet, playwright a#d'
>>> re.findall( exp, line )
['William', 'Shakespea#e', 'was', 'an', 'Englis#', 'poet', 'playwright','a#d']
Как показано, это работаеткак и предполагалось в интерпретаторе Python, но возвращает None
, когда тот же код выполняется в записной книжке Jupyter. Как придешь? Возможно, это как-то связано с кодировкой символов?