Я пытаюсь узнать об интернализации на веб-сайтах, поэтому я вмешиваюсь в файл конфигурации MySQL, параметры сортировки полей и тип набора символов заголовка html.
У меня в основном есть форма, где я набираю несколько символов юникода в текстовом поле, сохраняю их в базе данных, а затем выводю обратно в браузер.
Первый сценарий: HTML => utf8 MySQL => UTF8, все работает нормально. Однако, когда я просматривал базу данных из PhPMyAdmin, в поле были странные символы.
Второй сценарий: я настроил VARCHAR в базе данных на Latin1, выбрав сортировку swedish_ci. HTML остался utf8. Я ввел строку Unicode в форме. Тем не менее, браузер по-прежнему отображает правильные символы, которые я ввел !!!
Чтобы мне было проще понять, я скачал базу данных mysql world, которая представляет собой базу данных всех стран и городов мира. Таблицы кодируются латиницей1. Когда я пытаюсь отобразить их в формате utf8, он отображает странные символы для неанглийских символов. Это работает нормально, когда мой набор символов HTML-8591-1