Как UTF8_GENERAL_CI
было хорошим решением некоторое время назад.Теперь у него есть некоторые недостатки.
UTF8 в MySQL на самом деле использует 3 байта вместо 4, что вам нужно для символов, таких как эмодзи и новые азиатские символы.
Таким образом, в MySQL есть более новая кодировка под названием utf8mb4 , который фактически соответствует определению UTF8.
Чтобы иметь возможность полностью поддерживать азиатские языки, вам нужно будет выбрать utf8mb4.
Если вам нужна правильная сортировка внесколько языков, используйте utf8mb4_unicode
или utf8mb4_unicode_ci
вместо общего.
Более подробный ответ вы можете найти в В чем разница между utf8_general_ci и utf8_unicode_ci