Использование символов, отличных от ascii, в python регулярном выражении - PullRequest
0 голосов
/ 30 мая 2020

Я программирую бота Discord, который автоматически переводит единицы измерения между имперскими и метричными c. Я использую регулярное выражение, чтобы найти измерение в формате 5'9 ", и использую зависимость python re, чтобы проверить сообщения о разногласиях. Однако мои американские друзья не используют символ" в кавычках, они, по-видимому, use », который python будет отмечен как недопустимый символ при помещении в идентификатор (например, регулярное выражение). Могу ли я использовать свое регулярное выражение для проверки этого символа?

Мое начальное регулярное выражение:

(\d{1,}'\d{1,}"?)

Моя попытка создать новое регулярное выражение:

(\d{1,}['’]\d{1,}["”]?)

Я получаю сообщение об ошибке:

    feetpattern = re.compile("(\d{1,}['’]\d{1,}["”]?)")
                                                 ^
SyntaxError: invalid character in identifier

Что интересно, так это тот факт, что одинарная изогнутая кавычка, или ', похоже, не помечается. Понятия не имею, почему это так.

...