Метод машинного обучения для классификации с использованием спроса - PullRequest
0 голосов
/ 28 июня 2018

У меня есть следующий сценарий:

Мой ввод представляет собой набор баллов . Каждая точка (координаты Long_Lat) соответствует центроиду подраздела региона и имеет требование для школы. Как 50 детей, которым нужна школа по соседству.

После использования кластерного метода (, такого как k-means или DBscan ) для агрегирования этих точек по близости, я хочу распределить точки спроса по школам таким образом, чтобы кластер требовал (сумму все пункты требований к этому кластеру) выполнены.

Другими словами, я хочу создать школы в этом кластере и распределить детей ( баллов ) в эти школы.

Школы имеют фиксированное ограничение вместимости .

Т.е.: мне нужно 3 школы (вместимостью 40), чтобы удовлетворить потребности 100 детей (P1, P2, P3) кластера C4.

Основная цель - это, конечно, узнать местонахождение этих школ. Но я могу получить его, используя логику.

Какой метод я должен использовать для заполнения емкости кластера? Это правильный подход?

1 Ответ

0 голосов
/ 02 июля 2018

Для хорошо распределенных данных, я ожидаю, что наиболее эффективным способом будет начать с кластеризации k-средних. Если каждый полученный кластер соответствует возможностям школы, у вас есть решение.

Однако ваш случай "беспокойства" - это когда по крайней мере одна школа переполнена. Например, у вас 20 детей на северной стороне широкой реки, 90 на южной стороне, а вместимость школ - 40: вам нужно назначить по крайней мере 10 детей с юга на север.

Алгоритмический способ решения этой проблемы заключается в реализации другой функции ошибок: добавьте предложение, которое влечет за собой серьезные штрафы (т.е. + бесконечность стоимости), добавив 41-го студента в этот кластер.

Другим способом является нормальное агрегирование кластеров, но затем их корректировка. Скажем, что в школе SE 46 учеников, а в SW 44: отправьте 6 и 4 учеников, ближайших к северной школе, в эту школу.

Достаточно ли этого руководства для вас? Есть ли у вас случаи, когда у вас было бы несколько школ как с избыточной, так и с недостаточной нагрузкой? Я не хочу чрезмерно разрабатывать решение.

...