Как я могу сказать, что данные в таблице имеют неправильную кодировку? - PullRequest
0 голосов
/ 09 января 2009

У меня есть пара таблиц, для которых задан набор символов latin1, но я подозреваю, что они были ошибочно вставлены с некоторыми значениями, которые фактически кодируются с использованием utf8.

MySQL делает это немного сложнее, потому что он молча конвертирует все на основе настроек вашего соединения.

Как я могу проверить свою гипотезу о том, что в MySQL есть несколько байтов в кодировке utf8?

1 Ответ

2 голосов
/ 09 января 2009

Если вы найдете строки из 2 байтов, которые соответствуют следующей битовой комбинации:

110xxxxx 10xxxxxx

Скорее всего, это символы utf-8. Возможно, это 2 последовательных не-ascii латинских символа-1 (например, «Ä» или что-то непечатное), но это маловероятно.

...