Попытка добавить строку из df в dtm вызывает проблемы - PullRequest
1 голос
/ 23 марта 2020

Я хочу передать значение "Sentiment_2" из набора данных "df_full_m c" в "dtm dtmNB_df". Но когда я делаю это, он показывает мне следующую ошибку: Ошибка в

[<-.data.frame`(`*tmp*`, "y", value = c(1L, 1L, 1L, 1L, 1L,  :   replacement has 1256 rows, data has 1257.

Вот моя строка, которая вызывает проблему. Добавляется столбец Y, но есть только случаи NA.

dtmNB_df['y'] <- as.factor(df_full_mc[df_full_mc$ID %in% dtmNB$dimnames$Docs,]$Sentiment_2)

dtmNB_df имеет 1257 наблюдений. из 989 переменных, в то время как df_full_m c имеет 1284 об. из 3 переменных.

Наблюдения в dtmNB-df являются комментариями к видео на YouTube, которое я кодировал (Sentiment_2), и я хочу использовать подход Наивса-Байеса для контролируемого машинного обучения. Я попытался добавить дополнительный столбец, но это не сработало. Извините за вопрос, я впервые задаю вопросы здесь.

Заранее спасибо.

...