Почему параметр random_state используется в алгоритмах NMF и LDA?Каковы преимущества использования случайных тем, генерируемых каждый раз? - PullRequest
0 голосов
/ 08 февраля 2019

Для тематического моделирования,
Почему параметр random_state используется в алгоритме NMF и LDA?
Каковы преимущества использования случайных тем, генерируемых каждый раз?

1 Ответ

0 голосов
/ 11 февраля 2019

Алгоритмы для обоих являются стохастическими - это означает, что они используют случайность как часть оценки хорошего ответа.Это сделано таким образом, чтобы сделать его отслеживаемым, и в случае LDA вся модель является стохастической, обеспечивая в идеале вероятностное распределение (называемое «апостериорным распределением») ответов, но вместо этого предоставляя один вероятный ответ в видеоценить.

Таким образом, ответ заключается в том, что использование случайности в алгоритмах делает чрезвычайно сложную задачу намного проще и выполнимой для расчета менее чем за сто лет.

Если вы собираетесь их использовать, ядумаю, что вам будет полезно изучить их, узнать что-то о том, как они работают, почему они работают.Использование инструмента, который вы не понимаете, рискованно, так как вы не знаете, что на самом деле означает результат, который дает инструмент.Одним из примеров являются нумераторы слов во всех «темах» с очень низкой вероятностью.Различия в этих вероятностях на самом деле не имеют смысла - учитывая другую выборку из апостериорного, вы получите разные вероятности, по-разному ранжированные между словами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...