Я все еще новичок в pivot_table панд Python, и я пытаюсь изменить данные, чтобы получить двоичный индикатор, если значение находится в определенном наблюдении. Я следовал некоторым предыдущим кодам и получил некоторые обнадеживающие результаты, однако вместо 1 и нулей, как это мой идеальный результат, я получаю сумму. Пожалуйста, посмотрите небольшой образец данных, приведенный ниже
ID SKILL NUM
1 A 1
1 A 1
1 B 1
2 C 1
3 C 1
3 C 1
3 E 1
Результаты, к которым я стремлюсь:
ID A B C E
1 1 1 0 0
2 0 0 1 0
3 0 0 0 1
Мой код atm получит следующий результат:
ID A B C E
1 2 1 0 0
2 0 0 2 0
3 0 0 0 1
Должен ли я сначала удалить дубликаты ??
Код, который я использую atm, находится ниже;
df_pivot = df2.pivot_table(index='Job_posting_ID', columns='SKILL', aggfunc=len, fill_value=0)