Я все еще занимаюсь оценкой кластеров, сформированных с помощью кластеризации (обучение без учителя)?
Я пробовал поискать в Google, но меры, которые я получаю, слишком теоретические.Было бы здорово, если бы люди могли поделиться механизмами, которые они используют для оценки сформированных кластеров.Скажем, у меня есть Java Cluster, который будет содержать Java EE, Java ME, RMI, JVM и т. Д., Другой кластер, скажем, NoSQL, и будет иметь что-то вроде Neo4j, OrientDB, CouchDB и т. Д. Это прекрасно, и мой алгоритм кластеризации дал мне больше всеготочные кластеры.
Однако после обучения и тестирования я могу получить, скажем, MySQL, Oracle под кластером NoSQL, поэтому я просто выполняю ручную / визуальную интерпретацию, а затем заново тренирую свой алгоритм или настраиваю его, чтобы улучшить кластеризацию.
Теперь я хочу автоматизировать процесс визуализации кластеров вручную, и у меня есть система, которая дает мне точность сформированных кластеров.Я ищу что-то похожее на Precision, Recall, NDCG, Map и т. Д., Используемые в поиске.Мои кластеры различаются по длине, и может быть n - разные кластеры, поэтому точность / отзыв не будут правильными.