Question

Я хочу использовать кодировщик для категориальных данных, и у меня есть процесс, который преобразует ячейки ниже 1 в N / A. Они кажутся противоречивыми, потому что после того, как я конвертирую категорию и отправляю ее на обработку, он превращает 0 первого элемента в N / A.

Вот пример:

from sklearn.preprocessing import LabelEncoder
gle = LabelEncoder()
animal_labels = gle.fit_transform(df['animal'])
animal_mappings = {index: label for index, label in 
                  enumerate(gle.classes_)}
animal_mappings

результат is: {0: 'cat', 1: 'dog', 2: 'monkey'}

Это приводит к тому, что cat будет N / A. Можно ли указать di git для начала? Я бы поискал что-то вроде этого:

{1: 'cat', 2: 'dog', 3: 'monkey'}

Возможно ли, чтобы у энкодера был другой диапазон / начало с другого значения?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Возможно ли, чтобы у энкодера был другой диапазон / начало с другого значения?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы