Question

В настоящее время я работаю над разделением шума пассажиров в системе общественного транспорта.У меня есть только немаркированные данные, что означает, что я не могу учиться под наблюдением.

Данные состоят из определения MAC-адреса, местоположения и времени ...

Я работаю с данными и делю их на четыре функции

У меня есть четыре функции, такие какколичество обнаружений MAC для каждого идентичного MAC-адреса, расстояние для каждого идентичного пройденного MAC, продолжительность каждого MAC и скорость каждого MAC.

Я пробовал кластеризацию KMeans, результат, кажется, в порядке,

Я не уверен, какой метод обучения я должен использовать, чтобы наилучшим образом отделить два шума от пассажиров?
Каков наилучший способ оценкимодель?

Jon · Answer 1 · 10 октября 2018

Я думаю, что K-Means - это разумный метод обучения для кластерного упражнения, на которое вы намекаете.В зависимости от того, что вы пытаетесь достичь (например, возможно, обнаружение выбросов), я бы также рассмотрел возможность использования STL, если у вас есть эти данные во временном ряду.

Обучение без присмотра, чтобы разделить две группы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Обучение без присмотра, чтобы разделить две группы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы