Чтение Глобализация, шаг за шагом от Microsoft.
Я могу ответить на конкретные вопросы о CJKV, но вам, вероятно, нужна книга на эту тему. Я не читал, но CJKV обработки информации от O'Reilly (2-е издание в декабре 2008 года).
Я понимаю, что они используют фонетический ввод, преобразованный в письменные символы.
Как это работает в Интернете?
Ввод осуществляется классом программного обеспечения, называемым IME (Редактор метода ввода) в Windows, Mac и Linux (например, SCIM). Когда IME включен, ввод с клавиатуры сначала поступает в IME, и пользователь получает возможность выбрать правильную комбинацию кандзи / хирагана. Когда пользователь совершает коммит, нажимая клавишу возврата, IME набирает в кандзи / хирагана в веб-браузере, используя текущую кодировку. Ситуация с кодировкой была большой неразберихой, но если вы пишете веб-приложение, используйте кодировку Unicode. Я предлагаю UTF-8.
Срабатывают ли одни и те же события во время редактирования входных данных и текстовых областей?
Удобный веб-браузер Unicode и комбинированная ОС работают на нескольких языках. Например, можно использовать обычную английскую версию Firefox для просмотра и публикации на японском веб-сайте. С точки зрения браузеров, это просто массив «бла-бла-бла» в Unicode. Другими словами, если событие запускается на английском языке, то же самое событие должно запускаться в CJKV, если вы используете вариант Unicode.
Какие соглашения пользователи этих нисходящих языков ожидают в Интернете?
Читатели CJKV ожидают слева направо онлайн. Учебники по математике и естественным наукам написаны слева направо. Большинство текстовых процессоров, включая локализованную версию Word, пишут слева направо.
Какое влияние оказывает их двойной ввод (фонетический набор + преобразование) на веб-элементы управления?
В большинстве случаев вам не нужно беспокоиться об этом, если только вы не перехватываете события клавиатуры. Например, я ненавижу использовать японскую клавиатуру с кучей дополнительных клавиатур. Поэтому, когда мне нужно назначить команду включения / выключения IME для какой-либо клавиши на клавиатуре США. Я лично использую право - Alt. Кроме того, пробел и клавиша ввода используются во время преобразования, но не уверены, что эти события передаются в браузер.
Если хотите, я могу проверить ваш сайт. (мое имя пользователя) @ gmail.