Эта тема может быть старой, но мне показалось, что я добавляю свои 2 цента. Вот регулярное выражение, которое может быть использовано для сопоставления всех английских буквенно-цифровых символов, японского катакана, хирагана, многобайтовых буквенно-цифровых символов [ханкаку и дзенкаку], тире
/[一-龠]+|[ぁ-ゔ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+[々〆〤]+/u
Вы можете редактировать его в соответствии со своими потребностями, но обратите внимание на флаг "u" в конце.
Надеюсь, это поможет!