Для регрессии и бинарной классификации реализации деревьев решений (и, следовательно, RF) должны иметь возможность работать с категориальными данными. Идея представлена в оригинальной статье CART (1984) и говорит, что можно найти наилучшее разделение, рассматривая категории в порядке их среднего значения, а затем рассматривать их как таковые. Вы можете найти объяснение проблемы здесь
Для мультиклассовой классификации проблема немного сложнее.
В любом случае, этот метод МОЖЕТ привести к некоторому переоснащению, так как вы на самом деле используете некоторое целевое кодирование (это не должно быть слишком большой проблемой для радиочастот, может быть, больше для усиленных машин). Однако многие реализации не допускают автоматического разбиения c на категориальные переменные, поэтому полезно знать лучшие методы кодирования в деревьях. Я предлагаю эту среднюю статью и эту запись в блоге.
Наконец, некоторые реализации по-разному и эффективно работают с категориальными данными. Я предлагаю взглянуть на реализацию H2O , которая использует хороший метод биннинга для быстрого разделения.