В настоящее время я работаю над разделением шума пассажиров в системе общественного транспорта.У меня есть только немаркированные данные, что означает, что я не могу учиться под наблюдением.
Данные состоят из определения MAC-адреса, местоположения и времени ...
Я работаю с данными и делю их на четыре функции
У меня есть четыре функции, такие какколичество обнаружений MAC для каждого идентичного MAC-адреса, расстояние для каждого идентичного пройденного MAC, продолжительность каждого MAC и скорость каждого MAC.
Я пробовал кластеризацию KMeans, результат, кажется, в порядке,
Я не уверен, какой метод обучения я должен использовать, чтобы наилучшим образом отделить два шума от пассажиров?
Каков наилучший способ оценкимодель?