работает над набором данных, который объединяет выборку обзоров продуктов Amazon. Она уже дала нам данные под названием " autorevs ", а также создала для нас DTM с именем " revDTM " и TDM с именем " revTDM ".
нам сначала дали эти два кода, которые создают для нас два новых вектора:
products <- sample(unique(autorevs$asin), 250, replace=FALSE)
docs <- autorevs$doc_id[autorevs$asin %in% products]
она задает вопрос:
Затем создайте свои подмножества TDM и фрейма данных на основе векторов документов и продуктов, созданных на шаге 1. Сколько документов содержится в ваших подмножествах?
Должен ли я создавать два разных подмножества? или разделить мои "документы" и "продукты" вместе ...