Я применяю FeatureHasher
(под sklearn.preprocessing
) к категориальной переменной, которая принимает слишком много различных значений.После создания моей модели обучения я проверяю информацию о важности функций, и одна из переменных, которая, по-видимому, имеет большой вес в процессе принятия решений, является одной из результирующих закодированных переменных.
У меня вопрос, есть ли способ получить хэш-коды, связанные с каждым из категориальных значений.На самом деле, что мне действительно нужно, так это категории, включенные в эту конкретную кодированную переменную?
Любая помощь будет высоко ценится.