В настоящее время я пишу приложение ( App1 ), которое удаленно извлекает части текста из другого приложения (назовем его App2 ).В мире существует несколько экземпляров App2 , и все они интерпретируют свои строки в соответствии с их локальной системной кодовой страницей. App2 не поддерживает Unicode.
App1 извлекает текст из App2 без каких-либо указаний относительно кодовой страницы текста, но этоОжидается, что позднее будет предпринят ручной процесс выбора кодовой страницы для правильной интерпретации текста.
Предыдущие попытки автоматически определить кодовую страницу текста не увенчались успехом.
В то же время, в ожидании ручного определения, эти данные должны храниться в базе данных MySQL.
Каков наилучший способ хранения этих данных? В частности, что бы CHARSET
и COLLATION
лучше всего использовать здесь?
Я считаю, что MySQL не допустит вставки символов в поле, если они недопустимы для кодировки поля.
Было бы идеально, если бы я мог обнаружить кодовую страницуи преобразовать данные в Unicode перед вставкой в базу данных, но я не знаю, как это можно сделать последовательно и надежно.