У меня есть фрейм данных со столбцом с именем «msgText», который содержит тексты. Для этого я хочу создать еще один столбец с именем «wordcount», который подсчитывает, сколько слов содержит каждая строка «msgText».
Столбец выглядит следующим образом:
head(all_transcripts$msgText)
[1] "Hi, my name is Chris and I am a programmer"
[2] "I have worked with R for 12 years"
[3] "Being a programmer I have many questions"
[4] "The fellow programmers at Stackoverflow help me to get the answer"
[5] "This help has saved my life many times."
[6] "Thanks Stackoverflow!"
И результат, который я хотел бы получить:
head(all_transcripts$wordcount)
[1] 10
[2] 8
[3] 7
[4] 11
[5] 8
[6] 2
Для этого я использую библиотеку ngram
с функцией wordcount
.
Я пробовал:
all_transcripts$wordcount <- apply(all_transcripts, 2,
wordcount(all_transcripts$msgText))
Однако, делая это, я получил следующую ошибку:
Error in match.fun(FUN) : 'wordcount(all_transcripts$msgText)' is
not a function, character or symbol
Как правильно использовать функцию apply
, не используя цикл for в моем наборе данных?