Идентификация центров кластеров точек данных - PullRequest
0 голосов
/ 13 октября 2018

Как мне точно определить центр набора, казалось бы, случайно разбросанных точек?В качестве простого примера представьте, что я выстрелил из ружья по листу миллиметровки и у меня есть список координат X и Y каждого шарика, попавшего на бумагу.Как мне найти центр?

Вопрос 1) При условии, что только один кластер будет простым усреднением всех х и всех у, даст точный центр?

Теперь представьте, что вместо одного дробовика у меня есть два или три, то есть два отдельных набора точек.Человеческому глазу может быть очевидно, где находятся центры, но только с помощью списка значений x и y, как я могу их идентифицировать.

Вопрос 2) Учитывая несколько кластеров в одном и том жеобласть, как я могу различить их, и определить центр каждого из них по отдельности?

Я не ищу помощь в написании кода для этой проблемы, я ищу идеи для лучшего подхода к использованию.Моя текущая лучшая догадка - разделить целевую область на квадраты сетки, посчитать количество точек данных в каждом квадрате и сравнить с количеством точек в соседних квадратах.Если в квадрате больше точек, чем в соседних квадратах, это говорит о том, что он ближе к центру кластера.

Не уверен, что это актуально, но данные находятся в базе данных postgres, и я, вероятно, закодируюрешение с использованием c #.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...