Question

У меня есть набор данных 50000 наблюдений и 12 функций. Я применил logisti c регрессию и случайный лес к проблеме бинарной классификации, но я могу применить только одну модель, однако проблема в том, что я, кажется, не понимаю основную структуру моих данных и то, какую модель мне следует применять. Обе модели дают одинаковую точность. Существует 12 столбцов, из которых 3 являются категориальными, а остальные - цифрами c непрерывных столбцов.

Гистограмма функций:

, где я использовал пару и получил некоторую визуализацию, такую как

Данные не кажутся мне линейно разделимыми, но довольно беспорядочными, и мне кажется, что я должен применять случайный лес, но обе модели дают примерно одинаковую точность

Тепловая карта

Какую модель мне следует применить на основе моего набора данных?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Какую модель мне следует применить на основе моего набора данных?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы