У меня есть набор данных с несколькими странами, и я хочу создать фиктивную переменную для континентов.
На данный момент мой набор данных выглядит следующим образом:
+---------------+-----------+-----+-----+-----+
| Country | Period | X | Y | Z |
+---------------+-----------+-----+-----+-----+
| Argentina | 1991-1995 | ... | ... | ... |
| Argentina | 1996-2000 | ... | ... | ... |
| Bolivia | 1991-1995 | ... | ... | ... |
| Bolivia | 1996-2000 | ... | ... | ... |
| Brazil | 1991-1995 | ... | ... | ... |
| Brazil | 1996-2000 | ... | ... | ... |
| Canada | 1991-1995 | ... | ... | ... |
| Canada | 1996-2000 | ... | ... | ... |
| United States | 1991-1995 | ... | ... | ... |
| United States | 1996-2000 | ... | ... | ... |
+---------------+-----------+-----+-----+-----+
Мой желаемый результат следующий:
+---------------+-----------+-----+-----+-----+---------+---------+
| Country | Period | X | Y | Z | dummySA | dummyNA |
+---------------+-----------+-----+-----+-----+---------+---------+
| Argentina | 1991-1995 | ... | ... | ... | 1 | 0 |
| Argentina | 1996-2000 | ... | ... | ... | 1 | 0 |
| Bolivia | 1991-1995 | ... | ... | ... | 1 | 0 |
| Bolivia | 1996-2000 | ... | ... | ... | 1 | 0 |
| Brazil | 1991-1995 | ... | ... | ... | 1 | 0 |
| Brazil | 1996-2000 | ... | ... | ... | 1 | 0 |
| Canada | 1991-1995 | ... | ... | ... | 0 | 1 |
| Canada | 1996-2000 | ... | ... | ... | 0 | 1 |
| United States | 1991-1995 | ... | ... | ... | 0 | 1 |
| United States | 1996-2000 | ... | ... | ... | 0 | 1 |
+---------------+-----------+-----+-----+-----+---------+---------+
Итак, я хочу иметь пустышку для всехстраны Южной Америки и пустышка для всех стран Северной Америки.Я знаю, как создать пустышку для одной страны или года, но не для нескольких значений.