Правильное разделение значений зависимых переменных в машинном обучении? - PullRequest
0 голосов
/ 03 декабря 2018

Я делаю модель машинного обучения в Python, и в наборе данных есть только категориальные переменные.Я хочу, чтобы точность не превышала 90% (для значения 1 в зависимой переменной).

В исходных данных (необработанных данных YTD, которые я извлек из базы данных) отношение 1 к 0 было 61: 39 однако это меняется.Два месяца назад соотношение было 75:25.Я не получал точность, которую я хотел с этими данными.После некоторых проб и ошибок я понял, что если отношение 1 к 0 было 85:15, то я смогу получить точность как для 1, так и для 0) выше 90%.Другими словами, прогнозы для 1 и 0 оказались более чем на 90% правильными.Имейте в виду, я не сделал выборки или выборки.Я просто удалил несколько строк со значением зависимой переменной с 0, чтобы получить соотношение 1: 0 как 85: 15.

Я хочу знать, верен ли этот подход.

Спасибо

...