Что указывает оценка в моделировании темы - PullRequest
0 голосов
/ 06 ноября 2019

Я использовал gimsm для LSA согласно этому уроку https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python

, и я получил следующий вывод после запуска его для списка текста


[(1, '-0.708*"London" + 0.296*"like" + 0.294*"go" + 0.287*"dislike" + 0.268*"great" + 0.200*"romantic" + 0.174*"stress" + 0.099*"lovely" + 0.082*"good" + -0.075*"Tower" + 0.072*"see" + 0.063*"nice" + 0.061*"amazing" + -0.053*"Palace" + 0.053*"walk" + -0.050*"Eye" + 0.046*"eat" + -0.042*"Bridge" + 0.041*"Garden" + 0.040*"Covent" + -0.040*"old" + -0.039*"visit" + 0.039*"really" + 0.035*"spend" + 0.034*"watch" + 0.034*"get" + -0.032*"Buckingham" + 0.032*"Weather" + -0.032*"Museum" + -0.032*"Westminster"')]

Что означает -0,708 Лондон

1 Ответ

1 голос
/ 06 ноября 2019

Это слова, в основном способствующие вашей теме, как положительно, так и отрицательно. Кажется, одной из характеристик вашей темы является то, что она не имеет ничего общего с Лондоном. Вы можете видеть, что другие «лондонские» слова также негативно влияют на вашу тему: Вестминстер, Тауэр и Глаз также негативны для этой темы.

Так что, если в тексте отсутствует слово «Лондон», весьма вероятно, чтотекст об этой теме, согласно вашей модели.

...