Я довольно новичок в NLP,
Я хочу реализовать алгоритм кластеризации на основе Python, он будет иметь:
Так что проблема в том, что у меня есть кучаутверждений (20 утверждений * 5-6 слов на утверждение = 100-120 слов), связанных с заголовком.И алгоритм должен быть в состоянии их кластеризовать.
Для (1) - В качестве входных данных сначала у меня будет заголовок, из этого заголовка я хочу извлечь различные темы, например:
НАЗВАНИЕ: «Проблема в производственной сборочной линии» - Из этого я хочу извлечь что-то вроде
1.Механические проблемы
2.Проблемы с электричеством
3.Линейный менеджмент
4.Проблемы управления цепями поставок ......
И используйте эти извлеченные темы для объединения этих утверждений.Я могу выполнить вторую задачу кластеризации, но как извлечь темы из одного оператора, который содержит не более 6-7 слов?
Язык: Английский
Есть идеи, как решить первую проблему?