Найти выбросы или аномалию в данных GPS (время, широта, долгота, высота) - PullRequest
0 голосов
/ 04 июля 2019

У меня есть данные. На основании данных (время, широта, долгота, высота) определите типичные маршруты, которые устройство совершает в течение полной недели. После определения базовых маршрутов или типичной области, часто посещаемой устройством, мы можем начать определять аномалию на основе устройства, выходящего за пределы его частого маршрута / области.

Действие: после этого процесс отправит «предупреждение» системе, выходящей за пределы часто используемого маршрута.

Пожалуйста, предложите, какой алгоритм машинного обучения полезен. Я собираюсь начать алгоритм кластеризации. Также скажите мне, какие библиотеки Python полезны для использования алгоритма машинного обучения.

1 Ответ

0 голосов
/ 07 июля 2019

Прежде всего, если вы используете Python, а затем используйте scikit-learn.

Для этой проблемы существует множество возможностей.

Один из способов - использовать алгоритм кластеризации.Для этой цели, чтобы получить аномалию тоже, вы можете использовать DBSCAN.Это алгоритм, разработанный для получения кластера и выбросов.

Еще один способ (при условии, что у вас есть для каждого устройства все их позиции) использовать более забавный способ, например алгоритм кластеризации на всех позициях, чтобы получить важныеместо, и после LDA (скрытое выделение дирихле), чтобы получить основные темы (здесь слова будут индексом кластера, документ будет списком позиций каждого устройства, и поэтому темы будут основными «маршрутами»).

...