В произвольных наборах данных есть строковые столбцы, e. г. видов в ирисе множество. Я должен преобразовать их в маленькие целые числа для целей ML (матричные операции, поэтому только числа) и обратить их после вычислений. Например: {"setosa" -> 1, "versicolor" -> 2, "virginica" -> 3).
Я перебираю столбцы и проверяю тип каждого столбца (режим первого элемента). Если это символ (только проблемный режим), я хочу получить набор различных значений из этого столбца (например, 3 вида в наборе Iris), сопоставить их с последовательными целыми числами (поэтому у меня действительно будет матрица вместо фрейма данных) и перевернуть его после вычислений (например, показать прогнозируемые значения в целевом наборе в виде строк, а не произвольно отображенных целых чисел). Я думаю, что мне нужен индекс столбца отображения списка (я не знаю заранее, какие столбцы будут отображаться) для отображения (строка -> целое число) для конкретного столбца.