Преобразование китайского в пиньинь - PullRequest
5 голосов
/ 26 августа 2010

Я нашел в Интернете такие места, как http://www.chinesetopinyin.com/, в которых китайские иероглифы преобразуются в пиньинь (романизация) Кто-нибудь знает, как это сделать, или есть база данных, которая может быть проанализирована?

РЕДАКТИРОВАТЬ: я использую C #, но на самом деле предпочел бы базы данных / flatfile.

Ответы [ 4 ]

6 голосов
/ 26 августа 2010

возможное решение с использованием Python :

Я думаю, что база данных Unicode содержит лан-пиньинь для китайских символов, но они не включены в данные модуля unicodedata.

однако вы можете использовать некоторые внешние библиотеки, например cjklib , пример:

# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup

c = u'好'

cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
    print r

вывод:

hāo
hǎo
hào

ОБНОВЛЕНИЕ

cjklib поставляется с отдельной утилитой cjknife, которая может помочь.некоторое использование описано здесь

3 голосов
/ 26 августа 2010

Если вы используете Java, вы можете использовать pinyin4j.

http://pinyin4j.sourceforge.net/

0 голосов
/ 25 марта 2019

Да, это легко. Вместо этого используйте Google Translate. Он всегда показывает как китайские иероглифы, так и пиньинь ... Это БОЛЬШОЙ недостаток переводчиков MS (или Bing).

Большинству людей, не являющихся китайцами, необходим пиньинь, если они хотят иметь возможность правильно произносить китайский язык, находясь «в поле» (в среде, говорящей на китайском языке).

Опять же, решение простое ... вместо этого используйте Google Translate!

0 голосов
/ 26 августа 2010

Хорошо, сначала я использовал свой вопрос здесь, чтобы получить Unicode:

Преобразование китайских символов в Unicode

Затем взял файл, подобный этому, чтобы преобразовать его: http://www.ic.unicamp.br/~stolfi/voynich/Notes/061/uc-to-py.tbl

...