У меня есть набор данных для классификации мобильных цен, в котором у меня есть 20 объектов и одна целевая переменная с именем price_range. Мне нужно классифицировать мобильные цены как низкие, средние, высокие, очень высокие. Я применил однократное кодирование к моей целевой переменной. После этого я разбил данные на trainX, testX, trainy, testy. Таким образом, моя форма для trainX и trainy (1600,20) и (1600,4) соответственно. Теперь, когда я пытаюсь приспособить trainX и trainy к logisticRegresion, т.е. -> lr.fit (trainX, trainy), я получаю сообщение об ошибке: bad input (1600,4) Итак, я понял, что должен дать значение trainyв форме (1600,1), но с помощью одного горячего кодирования у меня есть массив из 4 столбцов для каждого отдельного ценового диапазона согласно концепции одного горячего кодирования.
Так что теперь я совершенно запутался, как люди используют одно горячее кодированиедля целевой переменной на практике? пожалуйста, помогите мне.