Так, например, у меня есть DataFrame pandas, который содержит столбец названий городов, и у меня уже есть большой предопределенный список названий городов, которые будут использоваться в качестве фиктивных переменных в модели.Я хотел бы, чтобы каждое название города в списке было добавлено в виде нового столбца, а затем заполнено связкой нулей и единиц, где строка в столбце названия города совпадает с именем столбца фиктивной переменной.
С моей точки зрения, мне нужно было бы сделать что-то вроде:
for dv in dummy_var_list:
df[dv] = df[df[city_names]==dv]
Я не уверен, будет ли это эффективным или правильным подходом.Мне нужно было бы включить какое-то утверждение или маскировку «если», в которых я не уверен, как это сделать.
т.е. у меня есть список названий городов:
['paris','sydney','orlando','milwaukee']
и у меня естьсписок предопределенных манекенов, из которых я должен сделать столбцы:
['tokyo','berlin','beijing','orlando','paris']
Таким образом, в некоторых строках не будет никаких '1', потому что совпадений нет, но это нормально.