удаление всех нелатинских символов в R - PullRequest
0 голосов
/ 06 октября 2018

здесь две строки

*3472459 PIVO 何か-何か-何か/100х1,5g

*3472459 VINO 何か何か何か100х1,5g

Как удалить все нелатинские символы?вывод должен быть

PIVO
Vino

1 Ответ

0 голосов
/ 06 октября 2018

с учетом текстовой строки в тексте, str_extract из stringr или stri_extract из stringi возвращает ожидаемый результат.

text <- c("*3472459 PIVO 何か-何か-何か/100х1,5g",
          "*3472459 VINO 何か何か何か100х1,5g")

stringr::str_extract(text, "[:alpha:]+")
[1] "PIVO" "VINO"

stringi::stri_extract(text, regex = "[:alpha:]+")
[1] "PIVO" "VINO"
...