Какие неконтролируемые алгоритмы машинного обучения можно использовать для категоризации предложений по фиксированному числу тем на основе определенных в них слов?Как выборы, так и слова президента подпадают под категорию политики.Я уже пытался руководствоваться lda для реализации этого, какие-либо другие предложения?
Вы можете использовать модель Word2vec для создания векторов предложений, а затем реализовать алгоритм кластеризации, например, k означает кластеризацию с количеством тем в качестве параметра для этих векторов.