Допустимо ли делать новые независимые переменные из старых? - PullRequest
0 голосов
/ 09 апреля 2020

Недавно мне было поручено задание по собеседованию в Data Science, и я посмотрел на переменные. Я подумал, насколько профессионально приемлемо сделать новую независимую переменную из старых (или, по крайней мере, изменить независимые переменные таким образом, чтобы потенциально получить больше полезных данных).

Например, одна из переменных имеет данные о состоянии / территории рождения человека. Таким образом, вместо того, чтобы пытаться моделировать с использованием более 50 категорий, создание новой переменной, которая будет классифицировать каждое состояние по регионам (Северо-Восток, Средний Запад, Юг и др. c.), Может привести к более значительному и более простому интерпретации анализа.

Я знаю, что цель, или то, что мы пытаемся ответить, важна, но мне интересно, подходит ли для задания для собеседования внесение совершенно новых переменных или значительных изменений, подобных этому?

Спасибо!

...