Самый простой и наиболее распространенный способ их сортировки - это просто двоичные данные, либо кодовые точки Unicode, или даже более простые, как необработанные двоичные данные (что хорошо работает для данных ASCII). К сожалению, это не делает для очень значимого порядка сортировки. Тем не менее, он объединяет все вместе, поэтому такие запросы, как префиксные запросы, должны работать.
Для значимого порядка сортировки не существует хорошего алгоритмического решения. Вам нужно будет работать с поисковыми таблицами (см., Например, этот поток о сопоставлении китайского и пиньинь, по которому вы затем сможете отсортировать).