Вы можете использовать gsub
, чтобы удалить первые два слова, а затем tapply
и считать, т.е.
i1 <- gsub("^\\w*\\s*\\w*\\s*", "", b$text)
tapply(i1, i1, length)
#what can I do for you?
# 2
Если вам нужно удалить любой диапазон слов, мы можем изменить i1
какследует,
i1 <- sapply(strsplit(as.character(b$text), ' '), function(i)paste(i[-c(2:4)], collapse = ' '))
tapply(i1, i1, length)
#hello I do for you? hi I do for you?
# 1 1