Совершенно правильно сделать это практически невозможно, поскольку некоторые китайские иероглифы имеют два или более произношения, например, 银行 = yin hang, 不行 = bu xing (последний символ идентичен, произносится в одном контексте и xing в другом). .. Кроме этого, вы могли бы, вероятно, свернуть свои собственные, используя базу данных Unicode, которая, я думаю, также содержит информацию о произношении. Если вы хотите быть более навороченным, я думаю, что есть несколько методов ввода с открытым исходным кодом, которые имеют сопоставления, и они будут иметь их и для слов, так что если вы найдете 银行 вместе, он будет знать, что второй символ - это зависание, не син OpenVanilla может иметь базы данных, с которыми вы можете работать (OSS).