MultiLabelBinarizer не работает для столбца с несколькими массивами - PullRequest
1 голос
/ 24 апреля 2019

У меня есть столбец с 15000 массивов.пожалуйста, найдите образец 2 таких записей из 15000. Я хочу создать макеты для значений в поле Genres_relevant.

user Genres_relevant    
 1         [2.0]
 2     [3.0,2.0,1.0]

Код:

from sklearn.preprocessing import MultiLabelBinarizer
df=pd.DataFrame(users_list['Genres_relevant'])
mlb = MultiLabelBinarizer()
pd.DataFrame(mlb.fit_transform(df),columns=mlb.classes_, index=df.index)

Ожидаемый результат

   1.0  2.0  3.0
1   0    1    0
2   1    1    1

Ошибка: форма передаваемых значений (12, 1), индексы подразумевают (12, 15000)

1 Ответ

1 голос
/ 24 апреля 2019
pd.DataFrame(mlb.fit_transform(df['Genres_relevant']), columns=mlb.classes_, 
         index=df.index)

Когда вы подходите, не передавайте полный фрейм данных, а передайте в столбце.

...