возможное решение с использованием Python :
Я думаю, что база данных Unicode содержит лан-пиньинь для китайских символов, но они не включены в данные модуля unicodedata
.
однако вы можете использовать некоторые внешние библиотеки, например cjklib , пример:
# coding: UTF-8
import cjklib
from cjklib.characterlookup import CharacterLookup
c = u'好'
cjk = CharacterLookup('T')
readings = cjk.getReadingForCharacter(c, 'Pinyin')
for r in readings:
print r
вывод:
hāo
hǎo
hào
ОБНОВЛЕНИЕ
cjklib поставляется с отдельной утилитой cjknife
, которая может помочь.некоторое использование описано здесь