Я хочу использовать эту кодировку для текста на тамильском языке, потому что она больше соответствует природе языка, а кодировка Unicode серьезно повреждает ( подробнее здесь ) внутреннюю c особенности объединения алфавитов.
Я хочу использовать регулярное выражение поверх этой кодировки. возможно ли это сделать с модулем python regex? или мне нужно написать для этого свой собственный автомат?