Как я могу уменьшить количество категорий в векторе на количество наблюдений? - PullRequest
0 голосов
/ 28 января 2019

У меня есть колонка с округом.Поскольку существует более 1000 различных округов, многие из них не заслуживают доверия.То, что я хочу сделать, это либо выбрать верхние n округов по количеству наблюдений, а остальные выделить в категорию «Другие».

После того, как я попробую модели с этой методологией, я исследую различные методы кластеризации.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...