Как мне узнать, насколько хорошо сработала моя кластеризация геопространственных данных? - PullRequest
0 голосов
/ 29 ноября 2018

У меня есть несколько координатных точек, каждая из которых связана с определенным ориентиром, однако они имеют различную и неизвестную степень точности.Для каждого из этих ориентиров у меня есть координаты, когда посетитель говорит, что он «на ориентире».

Я хотел бы использовать координаты «на ориентире» для повышения точности ориентиров для будущих посетителей.Однако, когда я изменяю параметры алгоритма кластеризации, у меня действительно нет возможности узнать, улучшаю ли я в действительности вероятность улучшения существующих мест или нет, в среднем.

Я хотел бы создатьобъективная функция, которую я мог бы использовать в качестве прокси для этого - какие-либо мысли?

Обратите внимание, что вызовы API карт Google, вероятно, будут ненадежными из-за несовершенных адресов ориентиров.

Ответы [ 2 ]

0 голосов
/ 30 ноября 2018

Если вы хотите свести все эти пользовательские теги к одной координате, я бы предложил (кроме линии даты) просто использовать медиану.

Причина в том, что медиана имеет очень высокую точку разбивкион устойчив к выбросам.

0 голосов
/ 29 ноября 2018

Одним из примеров является апостериорный модели гауссовой смеси.Вы можете найти несколько примеров здесь: https://ch.mathworks.com/help/stats/clustering-using-gaussian-mixture-models.html

Конечно, есть и другие алгоритмы кластеризации.Какой из них вы используете?

...