Короткий ответ: вам нужно знать о локали.
Не путайте кодировку с правилами сортировки локали. UTF-8 - это просто способ кодирования символов Unicode: он ничего не говорит о том, как вы обрабатываете сортировку, использование заглавных букв и т. Д.
Я приведу простой пример. Испанский язык имеет два сопоставления: традиционное (где «ch» считается буквой) и современное (где «ch» - две буквы). В традиционной сортировке вы сортируете так:
- Барро
- Cuenco
- Китай
- Dado
В современном сопоставлении вы бы отсортировали это так:
- Барро
- Китай
- Cuenco
- Dado
Это то же самое в UTF-8, Latin1, Latin9, cp850 или где-либо еще: кодировка не имеет значения.