DBSCAN предоставляется со строками в качестве ввода - PullRequest
0 голосов
/ 06 сентября 2018

Я новичок как в машинном обучении, так и в Python, и моя цель - поэкспериментировать с прогнозированием маршрутов с помощью кластеризации.

Я только начал использовать DBSCAN и смог получить результаты, используя массив координат в качестве входных данных для процедуры fit , например, [[1,1], [2,2], [3,3], ...], который включает в себя все координаты всех маршрутов.

Однако я действительно хочу предоставить DBSCAN набор, содержащий все маршруты / линии, а не набор, содержащий все координаты всех маршрутов. Поэтому мой вопрос: возможно ли это (имеет ли это смысл?) И если да, то как я могу это сделать?

Спасибо, что уделили время.

1 Ответ

0 голосов
/ 06 сентября 2018

Почему, по вашему мнению, кластеризация на основе плотность является хорошим выбором для кластеризации маршрутов ? Какое понятие плотность вы бы использовали здесь?

Я бы лучше попробовал иерархическую кластеризацию с правильным расстоянием маршрута.

Но если у вас в любом случае есть матрица расстояний , вы можете , конечно, просто попробуйте DBSCAN для нее "бесплатно" (вычисление расстояний будет way дороже, чем DBSCAN по матрице расстояний).

...