Допустим, у меня есть этот фрейм данных
id | car | sex | income
-------------------------------
1 | European | Male | 45000
2 | Japanese | Female | 48000
3 | American | Male | 53000
Есть ли простой способ создать его (используя панд)?
| id | car | choice | sex | income
1.| 1 | European | 1 | Male | 45000
2.| 1 | American | 0 | Male | 45000
3.| 1 | Japanese | 0 | Male | 45000
| ----------------------------------------
4.| 2 | European | 0 | Female | 48000
5.| 2 | American | 0 | Female | 48000
6.| 2 | Japanese | 1 | Female | 48000
| ----------------------------------------
7.| 3 | European | 0 | Male | 53000
8.| 3 | American | 1 | Male | 53000
9.| 3 | Japanese | 0 | Male | 53000
Идея состоит в том, чтобы получить все модальности переменной «car» в базе и указать, какую из них выбрал каждый человек через переменную «choice».Например, в первой таблице человек с id
1 выбрал европейский автомобиль, поэтому choice
равно 1 в строке, где car
- европейский, и ноль в строке, где car
- американский илиЯпонский.
Я уже кодировал что-то, что делает это вручную (используя словарь), но я хотел знать, существует ли более чистое решение.
(Это имеет целью отформатировать данные, чтобыиспользуйте asclogit / nlogit под Stata)