У меня есть data.frame
как следующее
df=data.frame(id=c("term 1", "term 1", "term 1", "term 2", "term 2", "term 3","term 3"), word1=c("hi",
"love", "wind", "by", "Jack", "yellow", "hate"),word2=c("love", "France", "green", "best", "black",
"bye", "by"),freq=c(2,1,1,2,2,1,1))
, что приводит к:
>df
id word1 word2 freq
1 term 1 hi love 2
2 term 1 love France 1
3 term 1 wind green 1
4 term 2 by best 2
5 term 2 Jack black 2
6 term 3 yellow bye 1
7 term 3 hate bye 1
Я хотел бы получить предложение из этого для каждого термина id
в data.frame df
с учетом частоты в freq
. Например:
"hi love hi love France wind green"
"by best by best Jack black Jack black"
"yellow bye hate"
Я пытался выполнить это, но моя попытка
rep(paste(df$word1, df$word2, sep = " "),df$freq)
дает неверный результат:
> rep(paste(df$word1, df$word2, sep = " "),df$freq)
[1] "hi love" "hi love" "love France" "wind green" "by best"
[6] "by best" "Jack black" "Jack black" "yellow bye" "hate by"