Преобразование базы данных из одной кодировки символов в другую - PullRequest
0 голосов
/ 21 октября 2009

У меня есть база данных MYSQL. В настоящее время текст хранится в кодировке latin1, сопоставление latin1_swedish_ci. Это значения по умолчанию, и это не было проблемой в тот день, когда база данных была изначально создана.

Я хочу переключиться на UTF8, чтобы кодировка текста в базе данных соответствовала кодировке текста, используемой в другом месте на веб-сайте, который использует базу данных.

Мой вопрос: какие проблемы у меня возникнут при преобразовании данных и на что мне следует обращать внимание, когда я это сделаю. Большая часть нашего текста вписывается в простой acsii, но, вероятно, есть случайные символы с акцентом там ...

Думаю, было бы разумно попросить совета о том, как лучше всего изменить данные.

Ответы [ 2 ]

2 голосов
/ 21 октября 2009

Если вы конвертируете из ASCII в UTF-8, я ожидаю, что кроме некоторых акцентированных символов, все будет в порядке. На мой взгляд, проблема в том, чтобы вернуться назад.

0 голосов
/ 21 октября 2009

Будьте внимательны, если вы перемещаете данные в другую таблицу. Если кодировка таблицы будет, например, latin1, и вы случайно положили туда необработанный UTF8, будет неудобно перекодировать его в правильную кодировку (если у вас нет исходных данных).

...