Вы можете явно указать docid_field
и text_field
примерно так:
data_corpus = corpus(x = data,docid_field = "doc_id", text_field = "text")
, где doc_id
и text
- это столбцы в кадре данных data
.
И затем вычислить матрицу элементов документа, используя функцию dfm
пакета qunateda
data_dfm = dfm(data_corpus)