sklearn ColumnTransformer несколько столбцов - PullRequest
0 голосов
/ 29 мая 2020

У меня есть csv файл с данными ie:

a_home_team,b_away_team,c_home_score,d_away_score,e_was_et
Arizona Coyotes,Montreal Canadiens,1,4,False
Colorado Avalanche,Florida Panthers,3,4,True

загрузка данных:

dataset['sum'] = dataset['c_home_score'] + dataset['d_away_score']
X = dataset.iloc[:, :-1].values
y = dataset['sum'].values

и пытаюсь сделать из названий команд числа 0 и 1

ct = ColumnTransformer(transformers=[('encoder', OneHotEncoder(), [0, 1])], remainder='passthrough')
X = np.array(ct.fit_transform(X))

, но когда я пытаюсь проверить этот массив X в IntelliJ, я получаю сообщение об ошибке:

UnboundLocalError: local variable 'rows' referenced before assignment

Я новичок ie в этой области, возможно, этот OneHotEncoder хорош только тогда, когда его 1 столбец с name

EDIT: Я сделал это с помощью get_dummies в pandas

df['sum'] = df['c_home_score'] + df['d_away_score']

df_home_team = pd.get_dummies(df['a_home_team'], dtype=np.int64)
df_away_team = pd.get_dummies(df['b_away_team'], dtype=np.int64)
df_teams = df_home_team.sub(df_away_team)
df_teams['score_sum'] = df['sum']

, но все же мне интересно, возможно ли достичь этой цели с помощью OneHotEncoder?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...