Question

Я новичок в анализе текста и застрял в вопросе, на который, похоже, нет ответа в документации (или, по крайней мере, я не могу его найти).

Я создал STM в R из Quanteda DfM, с которым связаны связанные документы. Темы основаны на новостных источниках, а в документах указаны новости и дата (одной строкой).

Оценка STM идет хорошо, но для моего проекта я действительно хочу знать, какие выпуски новостей и даты связаны с какими темами. По сути, я хочу вывод, такой как:

outlet_date             topic_1 topic_2 topic_3
newyorktimes_20181001   0.6     0.23      0.17
newyorktimes_20181002   0.54    0.4       0.06
newyorktimes_20181003   0.2     0.73      0.07

Возможно ли это?

Извините за отсутствие воспроизводимого примера - не уверен, как включить один, учитывая все шаги, чтобы добраться до этой точки. Большое спасибо!

Просмотр метаданных / документов, связанных с темами STM

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Просмотр метаданных / документов, связанных с темами STM

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы