Я использую искусственную сеть нейронов для приложения ML. Столбцы данных являются категориальными. Вот почему я использую все горячие методы кодирования для всех функций. Позвольте мне задать мою проблему. Представьте себе мою колонку,
ANTENNA_TYPE
1234
3345
3412
5435
5623
У меня 5 типов антенн. Когда я в режиме горячего кодирования, выходной сигнал будет иметь вид:
1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 0 0 0 1
После этого, в следующий раз, чтобы обучаться и прогнозировать.
Когда я хочу предсказать другой тип антенны как 9999, я не знаете, как я могу конвертировать в одно горячее кодирование? Есть ли кто-нибудь, кто предложит мне лучшую практику по этому поводу?
Заранее спасибо.
hot_encoder = OneHotEncoder(categorical_features=[1])
dataset = hot_encoder.fit_transform(dataset).toarray()