Question

Какое регулярное выражение соответствует любому китайскому символу в R?

[\\p{Han}] не работает должным образом.

v=c("a","b","c","中","e","文")
grep("[\\p{Han}]",v, value = TRUE)

[1] "a"

gersht · Answer 1 · 23 июня 2019

Согласно регулярные-выражения.info , «Движок JGsoft, Perl , PCRE, PHP, Ruby 1.9, Delphi и XRegExp могут соответствовать сценариям Unicode» .Поэтому установка perl = T должна давать правильные результаты.По умолчанию R является модифицированной версией двигателя TRE Вилле Лаурикари ( источник ):

grep("[\\p{Han}]", v, value = T, perl = T)

#### OUTPUT ####

[1] "中" "文"

Regex для соответствия любому китайскому символу в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Regex для соответствия любому китайскому символу в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов