Мне нужно конвертировать большой CSV в один горячий код np.ndarray для модели Keras.
For ex: csv data =
F1 F2 F3
1.'M' 'N' 'I'
2.'-' 'M' 'K'
Each Column's Possible Values
F1: ['-', 'M', 'N']
F2: ['-', 'A', 'B', 'M', 'N']
F3: ['-', 'I', 'J', 'K']
Expected Value(One hot encode in np.array)
F1 F2 F3
1. 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0
2. 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1
Я могу прочитать CSV, а затем анализировать строку за строкой.
Но это медленно, и у меня очень большой файл.
Есть ли способ использовать «pd.dataframe.apply» для преобразования в один горячий код?