У меня уже есть фрейм данных на уровне подсчета сроков документа, отмечая, что документы и термины просто индексируются целыми числами, а оценки представляют собой взвешенные непрерывные числа, если это уместно, например:
doc term count
1 2 2
1 5 3.1
2 2 0.4
3 5 5.9
Но в настоящее время это фрейм данных, и я хотел бы преобразовать его в формат dtm, чтобы использовать некоторые готовые к dtm функции (а именно, функцию «documents.compare» в RNewsflow).
Я пытался использовать «cast_dtm» через что-то вроде:
dtm <- as.matrix(df) %>% cast_dtm(document, term, count)
, где «df» - это кадр данных, рассмотренный выше, но я получаю следующую ошибку:
Error in UseMethod("ungroup") : no applicable method for 'ungroup' applied to an object of class "c('matrix', 'double', 'numeric')"