Мой вопрос является концептуальным и относится к этому вопросу к этому вопросу по расчету эффектов оценки.
При выполнении структурного топи c моделирования (с использованием stm-пакета в R) У меня есть возможность предварительно установить количество тем, на которые следует разделить корпус (K = x), или позволить программе индуктивно рассчитать количество тем (установите K = 0).
Каков процесс поиска наилучшего места для числа топи c, которое имеет существенный смысл, а не только статистический? Как объединить темы, которые, на мой взгляд, на самом деле едины, но которые алгоритм K = 0 считает разными?
Насколько я понимаю, существует несколько вариантов:
1) Подойдите к «сладкому месту», неоднократно изменяя фиксированное количество тем (K = 20, K = 25, K = 30 ...).
2) Попробуйте уменьшить количество тем на , включая дополнительные стоп-слова .
3) Возьмите выходные данные из K = 0 и , объедините темы вручную, считая их одним,
Какая из них является лучшей практикой?