Колонны трансформаторов выбраны для более чем одного трансформатора - PullRequest
0 голосов
/ 14 апреля 2020

Я хочу преобразовать столбцы данных через класс ColumnTransfomer. Для этого я использую функцию make_column_selector , чтобы назначить преобразователи, указав тип или шаблон. Мой вопрос: что произойдет, если столбец попадает в более чем один из этих критериев?.

Пример:

Я указываю через make_column_selector, что все dtypes плавают должен go через StandardScaler. Кроме того, я указываю, что все столбцы, имеющие шаблон binary_*, должны быть OneHotEncoded. Мой столбец binary_* также является плавающей точкой, он принимает только значения 0 и 1.

Будет ли этот столбец преобразован дважды (один HotEncoding и StandardScaler)? Будет ли он сначала перехватываться StandarScaler и игнорироваться OneHotEncoder?

Короче говоря, я хочу знать, распространяются ли столбцы через различные преобразователи преобразователя ColumnTransformer или они не соответствуют требованиям соответствия критериям один из трансфомеров.

1 Ответ

0 голосов
/ 16 апреля 2020

Я попробовал это сам. Трансформаторы ColumnTransformer выполняются последовательно в конвейерном режиме. Любой столбец, который соответствует критериям, установленным в make_column_selector преобразователя, будет проходить через преобразователь.

Это означает, что если один столбец соответствует критериям одного или нескольких преобразователей, он будет преобразован дважды и добавлен к результирующему кадру данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...