Использование символов Юникода - PullRequest
0 голосов
/ 27 января 2009

У меня проблема с юникодом. У меня многоязычный проект. Когда я ввожу данные на местном языке, в Access данные сохраняются примерно так: «à²… ಮà³à²®», но я хочу, чтобы эти символы местного языка были видны на заднем конце.

Не могли бы вы подсказать, как это сделать?

Я использую Java, Windows Vista и MS-доступ. Я установил кодировку базы данных с помощью класса свойств и передал ее методу getConnection. Хотя это не показывает, что я хочу. используя props.put("charset","utf-8") Я использую редактор плюс-редактор.

Ответы [ 5 ]

3 голосов
/ 27 января 2009

Вы должны проверять свои данные на каждом шаге, не , просто распечатав их в виде строки, но посмотрев, из каких символов юникода они состоят. Смотрите мою страницу отладки Unicode , которая написана для C #, но может применяться где угодно.

1 голос
/ 27 января 2009

Хороший ответ Джона Скита . Кроме того, я хочу призвать вас проверить всю поездку от браузера до базы данных, потому что иногда проблема в действительно неловком месте. В моем случае проблема была вызвана ошибкой в ​​ RequestDumperValve в Tomcat .

1 голос
/ 27 января 2009

Какие текстовые редакторы вы используете? убедитесь, что они поддерживают Unicode (предпочтительно utf8), также установите кодировку базы данных на utf8, и если ваш язык имеет специальную запись для строки Unicode, используйте ее (для Java, я думаю, что все строки являются Unicode, но, например, Python 2.5 и ниже нужно использовать u"....").

1 голос
/ 27 января 2009

Правильно ли настроена ваша база данных для использования кодировки Unicode? Похоже, что текст конвертируется или неправильно интерпретируется как не-Unicode формат.

1 голос
/ 27 января 2009

Какой язык программирования вы используете, абсолютно необходим. Конечно, не зная этого, вы все равно можете убедиться, что все компьютеры, на которых вы используете проект, используют одинаковую кодировку. Если вы используете оболочку bash, вы можете набрать echo $LANG, и это, вероятно, должно дать вам какой-то UTF-8. Имейте в виду, что многие программы, однако, будут не работать в локали оболочки, а в своей локали (особенно C). Хорошая идея - знать, на каком языке работает ваша оболочка, на каком языке работают все используемые вами программы и что означает этот языковой стандарт для кодировки текста.

Тем не менее, это примерно столько, сколько я могу сделать, не зная, какой язык использует ваш проект. И, в зависимости от языка, это может быть настолько, насколько я могу вам помочь, но кто-то наверняка заменит меня, если мы сможем выяснить, с каким языком мы здесь работаем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...