Правильный ответ , а не для жестких кодов. Никогда не используйте магические числа в своем коде Это кошмар обслуживания. Трудно читать, трудно писать, трудно отлаживать, трудно поддерживать. Откуда ты знаешь, что ты правильно понял цифры? Что происходит, когда они добавляют новые? Нет, не используйте магические числа. Пожалуйста.
Правильный ответ - использовать именованные сценарии Unicode, которые являются фундаментальным аспектом каждой кодовой точки Unicode:
[\p{Han}\p{Hiragana}\p{Katakana}]
Для этого требуется плагин XRegExp
для Javascript.
Настоящая проблема заключается в том, что регулярные выражения Javascript слишком примитивны для поддержки свойств Unicode и, следовательно, для поддержки Unicode. Возможно, когда-то это был приемлемый компромисс 15 лет назад, но сегодня это не что иное, как невыносимая небрежность, как вы сами обнаружили.
Вы также пропустите несколько Common
кодовых точек, указанных как kana в новом свойстве Script Extensions
, но, вероятно, неважно. Вы можете просто добавить \p{Common}
к указанному выше.