Данные, о которых вы говорите, являются категоричными.В основном данные, которые у вас есть в наборе данных, в основном порядковые (числовые) или категориальные.
Я бы порекомендовал вам обработать это путем преобразования категориальных переменных в фиктивные коды.Например, предположим, что у вас есть кадр данных, подобный приведенному ниже
Id, Country
1, US
2, UK
3, Germany
Преобразование этого в фиктивный код даст вам
Id, US, UK, Germany
1, 1,0,0
2, 0,1,0
3, 0,0,1
Существует несколько пакетов, которые преобразуют категориальные данные в фиктивные коды.Я думаю, что у панд тоже есть функция.
А затем приведенный выше фрейм данных можно использовать для обучения вашей модели