Сравнение / кластеризация траекторий (данные GPS точек (x, y)) и добыча данных - PullRequest
7 голосов
/ 06 февраля 2011

У меня есть 2 вопроса по анализу набора данных GPS.

1) Извлечение траекторий У меня есть огромная база данных зарегистрированных GPS-координат вида (latitude, longitude, date-time).Согласно значениям даты-времени последовательных записей, я пытаюсь извлечь все траектории / пути, по которым идет человек.Например;скажем, со времени M пары (x,y) непрерывно меняются вплоть до времени N.После N изменение в парах (x,y) уменьшается, и в этот момент я делаю вывод, что путь, пройденный со времени M до N, можно назвать траекторией.Это достойный подход, чтобы следовать при извлечении траекторий?Есть ли какие-нибудь известные подходы / методы / алгоритмы, которые вы можете предложить?Существуют ли какие-либо структуры данных или форматы, которые вы хотели бы предложить мне для эффективного поддержания этих точек?Возможно, для каждой траектории было бы полезно выяснить скорость и ускорение?

2) Разработка траекторий Как только у меня пройдены все траектории / пройдены пути, как я могу сравнить / кластерих?Я хотел бы знать, похожи ли начальная или конечная точки, тогда как сравниваются промежуточные пути?

Как сравнить 2 пути / маршруты и сделать вывод, похожи они или нет.Более того;как объединить похожие пути вместе?

Я был бы очень признателен, если бы вы указали мне на исследование или что-то подобное по этому вопросу.

Разработка будет на Python, но все видыпредложений библиотеки приветствуются.

Заранее спасибо.

Ответы [ 2 ]

9 голосов
/ 07 февраля 2011

Взгляните на работу, выполненную на факультете географии Цюрихского университета, особенно Патрик Лаубе и Сомайе Додж .

Взгляните на статью

Индивидуальные перемещения и добыча географических данных.Алгоритмы кластеризации для выделения горячих точек в персональных навигационных маршрутах

( ссылка , представление ).Он демонстрирует использование методов оценки плотности ядра DBSCAN для данных GPS.

Также здесь могут быть полезны документы из семинара Nokia Mobile Data Challenge 2012 , особенно:

MobReduce: Снижение состояния сложности следов мобильности ( ссылка )

от Фабиана Хартмана, Кристофа П. Майера, Ингмара Баумгарта и

A Очистка траекторииОсновы траектории кластеризации ( ссылка )

Агзама Идрисова, Марио А. Насименто, Университет Альберты

1 голос
/ 07 февраля 2011

1) Извлечение траекторий. Я думаю, вы в правильном направлении.Вероятно, в данных GPS будет какой-то шум, и при случайном хождении вы должны сделать плавные сплайны, чтобы преодолеть его.


2) Разработка траекторий. Есть ли какой-то бизнес-смысл в подобных траекториях?(Это поможет построить метрику расстояния, и тогда вы сможете использовать некоторые из алгоритмов кластеризации в мачо). 1. Я думаю, что точка, в которой остановился какой-либо человек, более интересна, поэтому вы можете генерировать статистику популярности мест.2. Если вам нужно сходство маршрутов, чтобы найти разные пути к одному и тому же начальному концу, вам нужно сначала кластеризовать начальное конечное местоположение, а затем сравнить кривые (максимальное расстояние между ними, интегральное расстояние - некоторые из хорошо известных функциональных метрик)

...