Я работаю над веб-приложением для изучения китайского / японского, в котором многие таблицы индексируются символами («глифами») этих языков.
Мне интересно, будет ли целочисленное значение кода глифа лучше для производительности, чем использование одного символа utf8 (для первичного ключа и индексов)?
Использование одного символа utf8 было бы очень полезно, потому что я прекрасно вижу символы юникода в используемой оболочке, и это облегчает отладку SQL-запросов этого приложения.
Теоретически MySQL рассматривал бы единственный символ utf8 как уникальное целочисленное значение, аналогично mediumint (3 байта) ... но я подозреваю, что MySQL вместо этого будет обрабатывать столбец как строку.
Будут ли проблемы с производительностью из-за того, что MySQL рассматривает мой единственный символ utf8 как строку?
Вы бы порекомендовали придерживаться целочисленной кодовой точки для индексов и первичных ключей и, возможно, использовать CONVERT () или другой оператор для получения символа utf8 в результатах?