Question

Мой вопрос является концептуальным и относится к этому вопросу к этому вопросу по расчету эффектов оценки.

При выполнении структурного топи c моделирования (с использованием stm-пакета в R) У меня есть возможность предварительно установить количество тем, на которые следует разделить корпус (K = x), или позволить программе индуктивно рассчитать количество тем (установите K = 0).

Каков процесс поиска наилучшего места для числа топи c, которое имеет существенный смысл, а не только статистический? Как объединить темы, которые, на мой взгляд, на самом деле едины, но которые алгоритм K = 0 считает разными?

Насколько я понимаю, существует несколько вариантов:

1) Подойдите к «сладкому месту», неоднократно изменяя фиксированное количество тем (K = 20, K = 25, K = 30 ...).

2) Попробуйте уменьшить количество тем на , включая дополнительные стоп-слова .

3) Возьмите выходные данные из K = 0 и , объедините темы вручную, считая их одним,

Какая из них является лучшей практикой?

Структурное моделирование топи c (STM): уменьшить количество тем в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Структурное моделирование топи c (STM): уменьшить количество тем в R

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы