Разбор китайских символов для возможного произношения / индекса CJK? - PullRequest
0 голосов
/ 03 октября 2018

Я делаю организующую программу (на C #) и пытаюсь создать функцию индексации для индексации CJK (и вьетнамского, если возможно).

Если есть китайская строка, яхотите проанализировать его по возможному индексу в китайском пиньинь / чжуинь, штрихах, корейском хангуле, японском хирагане или вьетнамском произношении.

Например, возьмите китайский символ на странице викисловаря , это может быть синтаксический разбор:

  • Китайский пиньинь , индекс принадлежит D
  • Китайский чжуинь ㄉㄨˊ, индекс принадлежит
  • японский よむ, индекс принадлежит
  • корейский индекс
  • вьетнамский đọc, индекс принадлежит Đ
  • имеет 22штрихи.

Я не знаю, что у китайского иероглифа не могло быть однозначного сопоставления, во время аренды я мог бы выбрать возможное / первое сопоставление.

Существует ли какая-либо существующая библиотека илирекомендуется составление карты?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...