Я делаю организующую программу (на C #) и пытаюсь создать функцию индексации для индексации CJK (и вьетнамского, если возможно).
Если есть китайская строка, яхотите проанализировать его по возможному индексу в китайском пиньинь / чжуинь, штрихах, корейском хангуле, японском хирагане или вьетнамском произношении.
Например, возьмите китайский символ 讀
на странице викисловаря , это может быть синтаксический разбор:
- Китайский пиньинь
dú
, индекс принадлежит D
- Китайский чжуинь
ㄉㄨˊ
, индекс принадлежит ㄉ
- японский
よむ
, индекс принадлежит よ
- корейский индекс
독
- вьетнамский
đọc
, индекс принадлежит Đ
- имеет 22штрихи.
Я не знаю, что у китайского иероглифа не могло быть однозначного сопоставления, во время аренды я мог бы выбрать возможное / первое сопоставление.
Существует ли какая-либо существующая библиотека илирекомендуется составление карты?