Regex для соответствия любому китайскому символу в R - PullRequest
5 голосов
/ 23 июня 2019

Какое регулярное выражение соответствует любому китайскому символу в R?

[\\p{Han}] не работает должным образом.

v=c("a","b","c","中","e","文")
grep("[\\p{Han}]",v, value = TRUE)

[1] "a"

1 Ответ

3 голосов
/ 23 июня 2019

Согласно регулярные-выражения.info , «Движок JGsoft, Perl , PCRE, PHP, Ruby 1.9, Delphi и XRegExp могут соответствовать сценариям Unicode» .Поэтому установка perl = T должна давать правильные результаты.По умолчанию R является модифицированной версией двигателя TRE Вилле Лаурикари ( источник ):

grep("[\\p{Han}]", v, value = T, perl = T)

#### OUTPUT ####

[1] "中" "文"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...