как получить топ 3 темы из каждого документа в моделировании темы - PullRequest
0 голосов
/ 25 сентября 2018
ap_ldanew1 <- LDA(data, k = 20, control = list(seed = 1234))    
ap_documents <- tidy(ap_ldanew1, matrix = "gamma")
ap_documents
ap_top_document <- ap_documents %>%
group_by(document) %>%
top_n(2, gamma) %>%
ungroup() %>%
arrange(gamma)

Я применил lda в моих текстовых данных DTM, когда я пытаюсь получить топ-3 темы для каждого документа, который я не получаю.Это дает всю тему, но я хочу только топ 3 темы для каждого документа.Выход:

doc   topic gamma
    1   1   0.028921062
    2   1   0.028921062
    3   1   0.028921062
    4   1   0.025357647
    5   1   0.033649733
    6   1   0.022576016
    7   1   0.028921062
    8   1   0.028921062
    9   1   0.028921062
    10  1   0.028921062
    11  1   0.033649733
    12  1   0.028921062
    13  1   0.025357647
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...