Когда я хочу добавить категорийное кодирование, я могу сделать это двумя различными способами:
- С помощью dfs с установкой категориального признака в качестве отношения и получением средней / стандартной / асимметричной статистики. В этом случае категорический признак и значение / с в одном и том же фрейме данных
- С подбиблиотекой категориального_кодирования и fit_transform
Я вижу единственную разницу в том, что во втором случае у меня более широкий диапазон параметров, т. е. установка метода = 'left_one_out', который может быть более точным, чем использование обычного среднего значения в случае dfs
Я прав? Если categoryor_encoding использует параллельную обработку?