Как правильно установить MultiLabelBinarizer? - PullRequest
0 голосов
/ 06 января 2020

У меня есть несколько меток (A, B, C, H, H1, H2 и т. Д. c). Однако, когда я подгоняю MultiLabelBinarizer, он разделяет H1 на H и 1. Может кто-нибудь сказать мне, есть ли решение для эта проблема помимо изменения метки H1 в другую метку. Спасибо

mlb = MultiLabelBinarizer()


labels = pd.DataFrame(mlb.fit_transform(df['LABELS']),columns=mlb.classes_)

1 Ответ

0 голосов
/ 06 января 2020

Решение состоит в том, чтобы добавить все возможные метки. Это означает, что вы должны были сохранить возможные метки в столбце файла Excel. В любом случае, это мой случай.

tags = pd.read_excel('/content/multi_labels.xlsx')
unique_tags = tags.Name.unique()
#one_hot_encode
mlb = MultiLabelBinarizer(classes=unique_tags)
labels = pd.DataFrame(mlb.fit_transform(df['LABELS']),columns=mlb.classes_)
...