Я новичок в анализе текста и застрял в вопросе, на который, похоже, нет ответа в документации (или, по крайней мере, я не могу его найти).
Я создал STM в R из Quanteda DfM, с которым связаны связанные документы. Темы основаны на новостных источниках, а в документах указаны новости и дата (одной строкой).
Оценка STM идет хорошо, но для моего проекта я действительно хочу знать, какие выпуски новостей и даты связаны с какими темами. По сути, я хочу вывод, такой как:
outlet_date topic_1 topic_2 topic_3
newyorktimes_20181001 0.6 0.23 0.17
newyorktimes_20181002 0.54 0.4 0.06
newyorktimes_20181003 0.2 0.73 0.07
Возможно ли это?
Извините за отсутствие воспроизводимого примера - не уверен, как включить один, учитывая все шаги, чтобы добраться до этой точки. Большое спасибо!