если вы зацикливаете символы в кодировке Unicode в python (2.x), скажите:
ak.sɛp.tɑ
Как вы можете определить, является ли текущий символ комбинационной диакритической меткой?
Например, последний символ в приведенной выше строке на самом деле является комбинированной меткой:
ak.sɛp.tɑ̃ -> ̃