Прогноз влияния возвращает ошибку с масштабированием сходства классов и bootstrap dfm - PullRequest
0 голосов
/ 21 июня 2020

большое спасибо за этот пакет! Мне это очень нравится.

В настоящий момент я применяю масштабирование сродства классов к bootstrap dfm парламентских речей. Это прекрасно работает; однако, когда я пытаюсь предсказать влияние функции на модель, я получаю следующую ошибку:

Fehler в replCmat4 (x, i1 = if (iMi) 0: (di [1] - 1L) else .ind.prep2 (i,: слишком много заменяемых значений

"Fehler" по-немецки означает ошибку. Это код, который я использую:

SP_textmodel_af_2 <- textmodel_affinity(SP_dfm_2, y = c(NA, NA, NA, -1, 1, NA), verbose = TRUE)
influence(SP_textmodel_af_2)

, который возвращает ошибку, которую я опубликовал выше. Эта ошибка появляется только тогда, когда я включаю свой последний шаг подготовки документа: «Используйте только слова, встречающиеся как минимум дважды в справочных документах». Если я не применяю это условие, прогноз влияния работает нормально. Итак Думаю, что-то не так с тем, как я применяю это условие к моему bootstrap dfm. Вот код, который я использую для этого шага:

docvars(SP_dfm_2[[1]], field = "ref_group") <- c(0, 0, 0, 1, 1, 0)
SP_dfm_FDPLinke <- dfm_subset(SP_dfm_2[[1]], ref_group > 0)
SP_dfm_FDPLinke <- dfm_trim(SP_dfm_FDPLinke, min_termfreq = 2, termfreq_type = "count", verbose = TRUE)
SP_features_FDPLinke2x <- as.character(featnames(SP_dfm_FDPLinke))

x <- c(1:101)
for (i in x) {
  SP_dfm_2[[i]] <- dfm_select(SP_dfm_2[[i]], pattern = SP_features_FDPLinke2x, selection = "keep")
} 

Я рад предоставить данные для репликации, если это поможет. Заранее спасибо!

...