В настоящее время я пишу scikit, изучаю один горячий сценарий кодирования, но когда я иду печатать столбцы, печатается только один, а их четыре.Ниже приведен код для одного горячего кодирования и заголовок кадра данных.Я в замешательстве, потому что когда я изменяю X обратно на df в строке 9, печатаются все столбцы, но в конце, когда я печатаю последнюю строку, печатается только первый столбец.
Code:
import numpy as np
import pandas as pd
X = df = pd.read_csv('Filename.txt')
#print(X.head(4))
X = X.select_dtypes(include=[object])
#print(X.head(4))
print(X.shape)
from sklearn import preprocessing
print(df.columns)
le = preprocessing.LabelEncoder()
X_2 = X.apply(le.fit_transform)
#print(X_2.head())
enc = preprocessing.OneHotEncoder()
enc.fit(X_2)
onehotlabels = enc.transform(X_2).toarray()
onehotlabels.shape
#print(onehotlabels)
Dataframe head:
2019-05-02,6,9,5
2019-05-01,0,4,4
2019-04-30,5,4,4
2019-04-29,2,4,7
2019-04-28,7,5,2