Как отфильтровать все короткие строки (2 и нижние символы) в корпусе? - PullRequest
0 голосов
/ 10 июня 2019

Учитывая простую строку:

t <- "hello world ww ff a wr gj dkjffdkn kuku"

VCorpus(VectorSource(t))

Я хочу отфильтровать все подстроки 2 и меньшей длины.Как я могу сделать это, используя пакеты qdap или tm?Я знаю, что могу использовать regex для этого, но есть ли функция, которая это делает?

1 Ответ

2 голосов
/ 10 июня 2019

С пакетом qdapRegex вы можете сделать:

rm_nchar_words(t, "1,2")

[1] "hello world dkjffdkn kuku"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...