Не только в тематическом моделировании, но и в других прогнозах вне выборки, вы можете использовать dfm_select()
с DFM в качестве шаблона, чтобы сделать функции DMF для обучения и набора тестов идентичными.
require(quanteda)
require(topicmodels)
corp_train <- data_corpus_irishbudget2010[1:7]
mt_train <- dfm(corp_train)
lda <- LDA(convert(mt_train, "topicmodels"), 10)
corp_test <- data_corpus_irishbudget2010[8:14]
mt_test <- dfm(corp_test)
mt_test <- dfm_select(mt_test, mt_train) # make the features identical
post <- posterior(lda, mt_test)
apply(post$topic, 1, which.max)