В настоящее время у меня есть список векторов, где каждое число в списке представляет количество различных слов в файле.
Я хотел бы изменить этот список на фрейм данных, где имена строк - это имена файлов, а столбцы - это слова (отсортированные в алфавитном порядке только с одним столбцом на слово), а в каждом наблюдении учитывается определенное слово, в которое включены все слова, использованные в любом файле (т. е. если файл a содержит слово, которое файл b не включаеттогда количество слов в файле b равно 0).
Таким образом, текущий код выглядит следующим образом:
file1 <- c(1,5,7,2)
names(file1) <- c("a", "by", "her", "the")
file2 <- c(10,5,2)
names(file2) <- c("a", "and", "to")
list(file1, file2)
То, что я хотел бы получить:
df <- data.frame(matrix(nrow=2, ncol=6, byrow=T, data=c(1, 0, 5, 7, 2, 0,
10, 5, 0,0,0,2)))
colnames(df) <- c("a", "and", "by", "her", "the", "to")
rownames(df) <- c("file1", "file2")
df
Спасибо.