Я хочу использовать кодировщик для категориальных данных, и у меня есть процесс, который преобразует ячейки ниже 1 в N / A. Они кажутся противоречивыми, потому что после того, как я конвертирую категорию и отправляю ее на обработку, он превращает 0 первого элемента в N / A.
Вот пример:
from sklearn.preprocessing import LabelEncoder
gle = LabelEncoder()
animal_labels = gle.fit_transform(df['animal'])
animal_mappings = {index: label for index, label in
enumerate(gle.classes_)}
animal_mappings
результат is: {0: 'cat', 1: 'dog', 2: 'monkey'}
Это приводит к тому, что cat будет N / A. Можно ли указать di git для начала? Я бы поискал что-то вроде этого:
{1: 'cat', 2: 'dog', 3: 'monkey'}