Какую кодировку я должен выбрать для транскрипции? - PullRequest
0 голосов
/ 14 декабря 2011

Мы с друзьями разрабатываем приложение для iphone и android.Нам нужно работать с транскрипцией слова.Какую кодировку (или даже специальный шрифт) мы должны выбрать для отображения правильной транскрипции слова в наших приложениях?

ОБНОВЛЕНИЕ (14 декабря 2011 г.): Я хотел бы предоставить больше информации.Я пытаюсь прочитать некоторые транскрипции из словаря Мюллера (http://sourceforge.net/projects/xdxf/files/dicts-XDXF/sdict05/comn_sdict_axm05_mueller24.tar.bz2/download) и получил проблемы с некоторыми символами. Я проверяю кодировку файла словаря с помощью enca

~/mueller24 % enca dict.xdxf                                                           
Universal transformation format 8 bits; UTF-8

Одним из проблемных слов является «живописец»Когда я открываю файл словаря в emacs, я вижу:

enter image description here

С данными работает наш скрипт, написанный на ruby. Он анализирует эту транскрипцию из словаря и сохраняет в базе данных. И после этого онвзял эту транскрипцию из базы данных и записал ее как json в файлы (utf-8). Если я открою этот файл в текстовом редакторе, я увижу его как эту строку \u0445peInt\u255a

И если я проанализирую его в своем приложении ипоказать на экране это выглядит так:

enter image description here

Где ошибка? Я полагаю, что проблема в разборе файла словаря. Чем, как правильно разобрать его?

1 Ответ

1 голос
/ 14 декабря 2011

UTF-8 (компактный и обратно совместимый)

...