Как я могу проверить Unicode или escape-последовательности в строке? - PullRequest
1 голос
/ 12 февраля 2012

У меня есть словарный список слов, некоторые слова содержат последовательности вроде:

K\xc3\xb6LN или KöLN при правильном отображении.

Я хотел бы очистить список таких слов, чтобы они содержали только простые символы ascii. Как я могу сделать простую проверку True / False, чтобы увидеть, содержит ли строка такие последовательности?

1 Ответ

5 голосов
/ 12 февраля 2012

str.isalpha() может помочь здесь:

>>> 'KöLN'.isalpha()
False
>>> 'K\xc3\xb6LN'.isalpha()
False
>>> 'Cologne'.isalpha()
True

Фильтрация:

>>> [word for word in ('KöLN', 'K\xc3\xb6LN', 'Cologne') if word.isalpha()]
['Cologne']
...