Возникли проблемы с Scikit, изучите один из них - PullRequest
0 голосов
/ 03 мая 2019

В настоящее время я пишу scikit, изучаю один горячий сценарий кодирования, но когда я иду печатать столбцы, печатается только один, а их четыре.Ниже приведен код для одного горячего кодирования и заголовок кадра данных.Я в замешательстве, потому что когда я изменяю X обратно на df в строке 9, печатаются все столбцы, но в конце, когда я печатаю последнюю строку, печатается только первый столбец.

Code:
import numpy as np
import pandas as pd

X = df = pd.read_csv('Filename.txt')
#print(X.head(4))

X = X.select_dtypes(include=[object])
#print(X.head(4))

print(X.shape)

from sklearn import preprocessing

print(df.columns)

le = preprocessing.LabelEncoder()

X_2 = X.apply(le.fit_transform)
#print(X_2.head())

enc = preprocessing.OneHotEncoder()

enc.fit(X_2)

onehotlabels = enc.transform(X_2).toarray()
onehotlabels.shape
#print(onehotlabels)

Dataframe head:
2019-05-02,6,9,5
2019-05-01,0,4,4
2019-04-30,5,4,4
2019-04-29,2,4,7
2019-04-28,7,5,2
...