Попытка создать dfm в R с помощью corpustools и получить следующую ошибку:
Ошибка в [<-.data.frame
(*tmp*
, поле, значение = список (список (), список () ,: заменяющий элемент 1 представляет собой матрицу / фрейм данных из 0 строк, необходимо 28465 **
Код:
tc = create_tcorpus(dataset, doc_column = 'id', text_columns = 'body',
split_sentences=T)
tc$preprocess(use_stemming = T, min_freq=10)
dfm = get_dfm(tc, 'feature')