Как представить документ из тестового набора с помощью Document-Term Matrix, созданного из данных обучения? (Скрытое семанти c индексирование) - PullRequest
1 голос
/ 05 мая 2020

Строю модель классификации документов из обучающего набора документов. Классификация выполняется посредством векторного представления каждого документа, то есть строки в матрице «документ-термин». Затем, чтобы протестировать модель, мне нужно представление каждого документа в тестовом наборе. Как я могу это сделать, если не все термины были включены в обучающий набор (отсюда и матрица документов-терминов)?

...