Что мне следует использовать для кластеризации сходства слов? и визуализирующая кластеризация в Python - PullRequest
0 голосов
/ 09 мая 2020

У меня есть матрица слов схожести:

Noun1     ability  absence  abundance  accent  access   accessory  account   accuracy
Noun2   
ability   1.00000 0.453362 0.374926  0.174432 0.448402 0.209143   0.404161  0.481537     
absence   0.453362 ....    .....     .......  .......  .......    .......   .......
abundance 0.374926 ...    .....     .......  .......  .......    .......   ......
accent    0.174432 ....    .....     .......  .......  .......    .......   ......
access    0.448402 ....    .....     .......  .......  .......    .......   .......

Каков наилучший метод получения кластеров на основе значения схожести слов? к тому же у меня есть только параметр подобия слов. Я пробовал иерархическую кластеризацию. однако этот метод может только определить количество кластеров вручную и не может извлекать кластеры.

...