Сохраняет ли использование pandas.factorize порядковый характер переменной? - PullRequest
1 голос
/ 17 апреля 2019

У меня есть набор строк в столбце, для которого я получил числовое значение, используя pandas.factorize.Но после преобразования я заметил, что d-тип столбца имеет тип int.

Строки в столбце имеют порядковый характер и, следовательно, числа должны представлять порядок, а не просто указываться как int.Должен ли я преобразовать числовой столбец в категорию, используя «as.type», или я могу передать столбец в свою модель машинного обучения без преобразования в категорию?

Пример: [T0, T1, T2] представляют серьезность рака.После факторизации результат равен [0,1,2].Но я сомневаюсь, устанавливает ли он отношения 0 <1 <2 </p>

1 Ответ

0 голосов
/ 18 апреля 2019
from pandas.api.types import CategoricalDtype
data['A'].astype(CategoricalDtype(ordered = True))

Этот созданный заказ после факторизации категориальной переменной

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...