Любые рубиновые драгоценные камни, чтобы сделать (китайский) Транслитерацию (Романизация), особенно для URL? - PullRequest
0 голосов
/ 05 марта 2012

Вообще говоря, он принимает текст в кодировке Юникод и пытается представить его в символах US-ASCII (универсально отображаемые символы без акцента), пытаясь транслитерировать произношение, выраженное текстом в некоторой другой системе записи, латинскими буквами.

ex,

"一二三".ooxx => "e-er-san"

После выполнения http://rubygems.org/search?utf8=%E2%9C%93&query=pinyin у меня появилось несколько рубинов, но ни один из них не подходит для этой проблемы.

1 Ответ

0 голосов
/ 06 марта 2012

Совершенно правильно сделать это практически невозможно, поскольку некоторые китайские иероглифы имеют два или более произношения, например, 银行 = yin hang, 不行 = bu xing (последний символ идентичен, произносится в одном контексте и xing в другом). .. Кроме этого, вы могли бы, вероятно, свернуть свои собственные, используя базу данных Unicode, которая, я думаю, также содержит информацию о произношении. Если вы хотите быть более навороченным, я думаю, что есть несколько методов ввода с открытым исходным кодом, которые имеют сопоставления, и они будут иметь их и для слов, так что если вы найдете 银行 вместе, он будет знать, что второй символ - это зависание, не син OpenVanilla может иметь базы данных, с которыми вы можете работать (OSS).

...