сказать, является ли символ объединяющим диакритическим знаком - PullRequest
3 голосов
/ 11 марта 2009

если вы зацикливаете символы в кодировке Unicode в python (2.x), скажите:

ak.sɛp.tɑ

Как вы можете определить, является ли текущий символ комбинационной диакритической меткой?

Например, последний символ в приведенной выше строке на самом деле является комбинированной меткой:

ak.sɛp.tɑ̃ -> ̃

1 Ответ

8 голосов
/ 11 марта 2009

Используйте модуль unicodedata:

import unicodedata
if unicodedata.combining(u'a'):
    print "is combining character"
else:
    print "is not combining"

эти сообщения также актуальны

Как изменить декомпозицию Unicode с помощью Python?

Каков наилучший способ удалить акценты в строке Unicode Python?

...