Это не так просто. Текст на большинстве европейских языков часто может быть написан с помощью простого набора предварительно составленных символов Юникода, но для многих более сложных сценариев вам необходимо обрабатывать составные символы. Это начинается довольно легко с объединения акцентов для западных алфавитов, прогрессирует через арабские буквы, которые являются контекстно-зависимыми (они имеют различные формы в зависимости от того, являются ли они первым, последним или в середине слова), и заканчивается полным безумием, которое встречается во многих индийских скриптах.
Стандарт Unicode содержит главы о тонкостях, связанных с рендерингом различных скриптов, которые он может кодировать. Просто попробуйте, например, описание тибетского языка в начале 10-й главы, и если это вас не пугает, вернитесь к деванагари в 9-й главе. Вы быстро отбросите свое стремление «писать текст на любом языке». , Для этого требуется специальное программное обеспечение для рендеринга, написанное экспертами, хорошо знакомыми с соответствующими сценариями.