Маллет создает темы с ключевыми словами.Ключевые слова являются уникальными для одной темы.Существует ли автоматический способ выбрать определенное слово или несколько слов из ключевых слов темы в качестве метки темы.Например, 20 тем генерируются из 500 статей.Каждая тема содержит 20 слов.Одной из тем является:
идентификатор темы 12, вес 0,05879, (ключевые слова) нефть энергия газ электроэнергия вода электричество атомная промышленность море климат цены цены уголь углерод выбросы год топливо экологические зеленые годы
Кажется, у меня могут быть разные интерпретации темы.Например,
- проблемы с энергией от сжигания газа, нефти или топлива
- производство электроэнергии для защиты окружающей среды
- изменение цен на нефть из-за изменения климата
- выбросы углерода вызывают проблемы с окружающей средой
- ...
Одним словом можно обозначить: энергия, окружающая среда, нефть, выбросы углерода, экологически чистая энергия ...
Есть ли способ генерировать только одно или два слова для представления этой темы вместо субъективного и произвольного объединения этих слов?
Кажется, наиболее важные слова определяются частотой терминов в алгоритме ключевых слов.Маллет генерирует уникальные слова для каждой темы.
Мой вопрос: есть ли способ автоматически выбрать одно наиболее представительное слово или два слова в качестве метки темы?
Я новичок в моделировании темы, вы мне поможете?
Спасибо