Я хочу преобразовать пиньинь, где тональные метки написаны с акцентами (например, Nín hǎo), в пиньинь, написанный в числовой форме / в формате ASCII (например, Nin2 hao1).
Кто-нибудь знает о каких-либобиблиотеки для этого, желательно PHP?Или знаете китайский / пиньинь достаточно хорошо, чтобы комментировать?
Я сам начал писать один, который был довольно простым, но я не говорю по-китайски и не до конца понимаю правила, когда слова должны быть разделены с помощьюпробел.
Мне удалось написать переводчик, который преобразует:
Nín hǎo. Wǒ shì zhōng guó rén
==> Nin2 hao3. Wo3 shi4 zhong1 guo2 ren2
Но как вы обрабатываете слова, подобные следующим -они разделяются пробелом на несколько слов или вы вставляете тональные числа в слове (если да, то где?): huā shíjiān
, wèishénme
, yuèláiyuè
, shēngbìng
и т. д.