Предположим, у меня есть некоторый DataFrame:
import numpy as np
import pandas as pd
df = pd.DataFrame(
{
'a': list('abcde'),
'b': list('aaabb')
}
)
И я хочу использовать sklearn.compose.ColumnTransformer
для его преобразования:
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder
transformer = ColumnTransformer(
[
('a', OneHotEncoder(), ['a']),
('b', OneHotEncoder(), ['b']),
]
)
transformer.fit(df)
Я могу получить имена функций из этого преобразователя, напримерИтак:
transformer.get_feature_names()
# ['a__x0_a', 'a__x0_b', 'a__x0_c', 'a__x0_d', 'a__x0_e', 'b__x0_a', 'b__x0_b']
Но как я могу получить сопоставление исходной «родительской» функции с каждой «дочерней» функцией?