Обучение без присмотра, чтобы разделить две группы - PullRequest
0 голосов
/ 10 октября 2018

В настоящее время я работаю над разделением шума пассажиров в системе общественного транспорта.У меня есть только немаркированные данные, что означает, что я не могу учиться под наблюдением.

Данные состоят из определения MAC-адреса, местоположения и времени ...

Я работаю с данными и делю их на четыре функции

У меня есть четыре функции, такие какколичество обнаружений MAC для каждого идентичного MAC-адреса, расстояние для каждого идентичного пройденного MAC, продолжительность каждого MAC и скорость каждого MAC.

Я пробовал кластеризацию KMeans, результат, кажется, в порядке,

  1. Я не уверен, какой метод обучения я должен использовать, чтобы наилучшим образом отделить два шума от пассажиров?

  2. Каков наилучший способ оценкимодель?

1 Ответ

0 голосов
/ 10 октября 2018

Я думаю, что K-Means - это разумный метод обучения для кластерного упражнения, на которое вы намекаете.В зависимости от того, что вы пытаетесь достичь (например, возможно, обнаружение выбросов), я бы также рассмотрел возможность использования STL, если у вас есть эти данные во временном ряду.

...