Возможно ли, чтобы у энкодера был другой диапазон / начало с другого значения? - PullRequest
1 голос
/ 10 июля 2020

Я хочу использовать кодировщик для категориальных данных, и у меня есть процесс, который преобразует ячейки ниже 1 в N / A. Они кажутся противоречивыми, потому что после того, как я конвертирую категорию и отправляю ее на обработку, он превращает 0 первого элемента в N / A.

Вот пример:

from sklearn.preprocessing import LabelEncoder
gle = LabelEncoder()
animal_labels = gle.fit_transform(df['animal'])
animal_mappings = {index: label for index, label in 
                  enumerate(gle.classes_)}
animal_mappings

результат is: {0: 'cat', 1: 'dog', 2: 'monkey'}

Это приводит к тому, что cat будет N / A. Можно ли указать di git для начала? Я бы поискал что-то вроде этого:

{1: 'cat', 2: 'dog', 3: 'monkey'}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...