Как правильно проверить, является ли ввод корейским или китайским с использованием JavaScript? - PullRequest
0 голосов
/ 25 октября 2018

Мое приложение полагалось на эту функцию, чтобы проверить, является ли строка корейской или нет:

const isKoreanWord = (input) => {
  const match = input.match(/[\u3131-\uD79D]/g);
  return match ? match.length === input.length : false;
}

isKoreanWord('만두'); // true
isKoreanWord('mandu'); // false

, пока я не начал включать поддержку китайского языка, и теперь эта функция не согласована:

isKoreanWord('幹嘛'); // true

Я полагаю, что это связано с тем, что корейские и китайские символы смешаны в одном и том же диапазоне Юникода.

Как мне исправить эту функцию, чтобы она возвращала true, если ввод содержит только корейские символы

1 Ответ

0 голосов
/ 25 октября 2018

Вот диапазон юникода, который вам нужен для хангыль (взято с их википедии страницы).

U+AC00–U+D7AF
U+1100–U+11FF
U+3130–U+318F
U+A960–U+A97F
U+D7B0–U+D7FF

Итак, ваше регулярное выражение .match должно выглядеть так:

const match = input.match(/[\uac00-\ud7af]|[\u1100-\u11ff]|[\u3130-\u318f]|[\ua960-\ua97f]|[\ud7b0-\ud7ff]/g);
...