Mysql colation для всех языков - PullRequest
       5

Mysql colation для всех языков

18 голосов
/ 20 сентября 2009

В настоящее время я занимаюсь разработкой веб-сайта, на котором будут представлены материалы практически для любого языка в мире. И у меня проблемы с выбором лучшего сопоставления для определения в MySQL.

Какой из них лучше всего поддерживать всех персонажей ??? Или самый точный ???

Или лучше всего конвертировать все символы в юникод?

спасибо

Ответы [ 2 ]

18 голосов
/ 20 сентября 2009

Я обычно использую 8-битный формат преобразования UCS / Unicode, который идеально подходит для любого (ну, большинства) языков

utf8_general_ci

http://dev.mysql.com/doc/refman/5.0/en/charset-unicode.html

4 голосов
/ 07 марта 2019

Принятый ответ неверен (возможно, он был прав в 2009 году).

utf8mb4_unicode_ci - лучшая кодировка для широкой языковой поддержки.

Аргументация и подтверждающие доказательства:

Вы хотите использовать utf8mb4 вместо utf8, поскольку последний поддерживает только 3-байтовые символы, а вы хотите поддерживать 4-байтовые символы. (ссылка)

и

Вы хотите использовать unicode вместо general, потому что последние никогда не сортируются правильно. (см)

...