Если цель состоит в том, чтобы найти частоту каждого жанра, тогда мы делаем split
в столбце «жанр» в качестве разделителя |
и используем mtabulate
library(qdapTools)
mtabulate(strsplit(as.character(df1$genre), "|", fixed = TRUE))
Или используя table
из base R
dat <- stack(setNames(strsplit(as.character(df1$genre), "|",
fixed = TRUE), seq_len(nrow(df1))))
lvls <- c("Action', 'Adventure', 'Animation', 'Comedy', 'Fantasy')
dat$values <- factor(dat$values, levels = lvls)
table(dat[2:1])
ПРИМЕЧАНИЕ. Предполагая, что все категории находятся в наборе данных