Справочная информация:
У меня есть база данных MySQL с таблицей, в которой есть поля VARCHAR, которые всегда были latin1;Я могу использовать PHP / веб-интерфейс для копирования / вставки символов Unicode, которые пришли из UTF8, и добавленная запись может быть извлечена и выглядит хорошо.Когда я использую C CI интерфейс для создания записи, вы видите последовательность байтов.Глядя на разницу, я вижу, что на основе PHP введено что-то вроде 芳
для символов (последовательность из них для каждого символа), где в версии C просто выведите последовательность в виде байтов / символов.
Вопрос:
Я бы хотел сохранить базу данных в латинице 1, чтобы существующие данные были в порядке, но когда все происходит в формате UTF8, если для символа не существует перевода laten1, используйте UTF8.Я могу обнаружить это в C, но какой порядок следования байтов использует формат &#
и где я могу найти информацию об этом?Мой план состоял бы в том, чтобы обнаружить символы UTF-8 и создать формат &#
для заполнения полей.Есть ли какие-либо недостатки в этом?
TIA !!