Исходя из земли Perl, я могу сделать что-то вроде следующего, чтобы проверить членство строки в определенном блоке Unicode:
# test if string has any katakana script characters
my $japanese = "カタカナ";
if ($japanese =~ /\p{InKatakana}/) {
print "string has katakana"
}
Я читал, что Python не поддерживает юникодные блоки (правда?) - так как лучше всего выполнить это вручную? Например, вышеуказанный диапазон блока Юникода для {InKatakana} должен быть U + 30A0… U + 30FF. Как я могу проверить диапазон Юникода в Python? Любые другие рекомендуемые решения?
Я бы предпочел не использовать внешнюю оболочку, например Ponyguruma , чтобы ограничить количество зависимостей для развертывания / обслуживания.