Соответствие регулярному выражению для неанглийского языка в Python - PullRequest
2 голосов
/ 25 января 2011

Я пытаюсь захватить и сопоставить символы русского языка в скрипте Python.Поскольку русские символы не попадают в тип [aZ], какое регулярное выражение я должен использовать, чтобы соответствовать им.Я не могу использовать (. *), Потому что это будет соответствовать всем.

linkpat = re.compile('name=[a-Z]+;size=[0-9]+')

Ответы [ 3 ]

4 голосов
/ 25 января 2011

Используйте флаг Unicode:

re.compile('name=\w+;size=\d+', re.U)

это также будет соответствовать любой букве на любом языке (плюс подчеркивание), но не только на русском.

1 голос
/ 25 января 2011

Вы можете попробовать \w с правильным МЕСТНЫМ

0 голосов
/ 25 января 2011

Используйте классы символов, которые зависят от локали

...