PHP регулярное выражение для принятия японского и английского языков - PullRequest
0 голосов
/ 29 мая 2018

Я пытаюсь создать регулярное выражение для фильтрации только алфавитов или цифр из английского и японского языков.Это то, что я пробовал,

preg_match('/(?![\n\r])[\x00-\x1F\x80-\xFF][^\x4e00-\x9fa0)]/u', $value)

Но я не получаю желаемого результата.Что я могу делать не так?

1 Ответ

0 голосов
/ 29 мая 2018

Вы должны использовать unicode character properties Также вы можете посмотреть на этом сайте, который содержит некоторые другие примеры регулярных выражений http://www.localizingjapan.com/blog/2012/01/20/regular-expressions-for-japanese-text/

Обновлен список персонажей на основе @ Álvaro Gonzálezобратите внимание на три алфавита.

это регулярное выражение должно делать то, что вы ожидаете:

preg_match('/[\p{L}\p{N}\p{Katakana}\p{Hiragana}\p{Han}]+/u', $value)

\p{L} будет соответствовать любой букве, \p{N} любому числу и \p{Katakana} будетсоответствует любому символу Katakana и т. д. *

Вам может потребоваться добавить разделители слов в допустимые символы, если вы не соответствуете одиночным словам

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...