Я не говорю на телугу (извините!), Но я понимаю, что это слоговый язык, в котором слоги состоят из гласных («ачу») и согласных («галлу»). Итак, как объясняет wikipedia , вы получите «шестьдесят символов, из которых 16 - гласные, три модификатора гласных и сорок один согласный». Эта страница показывает соответствие Unicode: гласные от 0C05 до 0C14 (а также 0C60 и 0C61, «вокальные» RR и LL); согласные от 0C15 до 0C39; другие коды - это множество «знаков, знаков препинания, цифр» и т. д.
Полная таблица возможных слогов находится на в этом PDF , но я признаюсь, что сценарий сбивает меня с толку, так как мне трудно сказать, что к чему. Если вы говорите на телугу или имеете легкий доступ к людям, которые делают это, вам будет легче рассказать, как вырезать слоги из потока символов телугу, чем я. Python не имеет к этому никакого отношения - это всего лишь один из многих языков программирования, который может позволить вам реализовать любой алгоритм , необходимый вам для слогового определения, но он определенно не имеет такого встроенного алгоритма. ! -)