One Hot Encoding - как исправить совпадение столбцов в логистической регрессии - PullRequest
0 голосов
/ 10 апреля 2019

У меня возникла проблема в логистической регрессии с одним горячим кодированием.

Это мой сценарий.

У меня есть данные поезда с категориальной функцией, закодированные с использованием одной горячей кодировки.

   Limit        Color       Output (Predicted Output)
   4            Red         1
   2            Blue        0
   6            Yellow      1

И после использования одного горячего кодирования для функции цвета у меня есть 2 дополнительные функции (как и ожидалось), такие как

Limit       Color_Red   Color_Blue  Color_Yellow    Output
4               1           0            0            1
2               0           1            0            0 
6               0           0            1            1

И я создал модель, оценил и оценил ее с помощью логистической регрессии, и она работает нормально, как и ожидалось.

Теперь я хочу предсказать вводимые пользователем данные и структуру ниже.

Limit       Color   
6           Red 

И преобразовал одну горячую кодировку для функции цвета, и я получил эту структуру.

Limit       Color_Red   
6             1

И когда я вызвал функцию modle.predict, передавая эти входные данные, я получил ошибку ниже.

X has 2 features per sample; expecting 4 И, конечно, количество элементов входных данных не совпадает с количеством элементов входных данных модели.

Как это исправить и оценил вашу помощь.

Привет
Абдул

...