Мой набор данных выглядит следующим образом:
Симптомы (X) :: Состояние (Y)
лихорадка, головная боль, слепота :: синдром Вагнера
боль в зубе, лихорадка, сладкая моча :: buriболезни Бури
слепота, носовое кровотечение, лихорадка :: синдром Тейлора
, где X - особенности, а Y - мои ярлыки.Я хотел бы закодировать X в матрицу горячего кодирования.get_dummies от panda не может обрабатывать несколько значений в одном столбце, но если я разделю X на несколько столбцов, я потеряю способность кодировать симптомы в одну и ту же горячую матрицу
есть идеи?