у вас есть разные варианты преобразования категориальных переменных в числовые или двоичные переменные.например, столбец страны в вашем фрейме данных имеет разные значения (например, Франция, Китай ,, ...).Одним из решений, которое вы можете преобразовать в числовые переменные, является: {Франция: 1, Китай: 2, ....}
#import libraries
from sklearn import preprocessing
import pandas as pd
#Create a label encoder object and fit to Country Column
label_encoder = preprocessing.LabelEncoder()
label_encoder.fit(df['Country'])
# View the label {France,China,...}
list(label_encoder.classes_)
# Transform Country Column to Numerical Var
label_encoder.transform(df['Country'])
# Convert some integers into their category names --->{China,China,France}
list(label_encoder.inverse_transform([2, 2, 1]))