У меня есть данные, структурированные так:
id_1 id_2 cost
85358 138544 60
85358 210261 60
85358 121693 60
85358 210264 60
85358 156498 60
85358 210272 60
85358 210275 60
85358 154615 60
85358 171304 60
85358 138547 60
85358 171304 150
85358 210272 150
85358 156498 150
85358 210264 150
85358 138547 150
85358 138544 150
85358 210275 150
85358 121693 150
85358 210261 150
85358 154615 150
85358 138544 155
85358 210264 155
85358 210261 155
85358 121693 155
85358 210275 155
85358 154615 155
85358 210272 155
85358 171304 155
85358 156498 155
85358 138547 155
Я надеюсь создать новый столбец, который разделяет различное число id_2
, связанное с каждым id_1
и cost
Таким образом, конечный продукт будет выглядеть примерно так:
id_1 id_2 cost distinct calc
85358 138544 60 10 6.00
85358 210261 60 10 6.00
85358 121693 60 10 6.00
85358 210264 60 10 6.00
85358 156498 60 10 6.00
85358 210272 60 10 6.00
85358 210275 60 10 6.00
85358 154615 60 10 6.00
85358 171304 60 10 6.00
85358 138547 60 10 6.00
85358 171304 150 10 15.00
85358 210272 150 10 15.00
85358 156498 150 10 15.00
85358 210264 150 10 15.00
85358 138547 150 10 15.00
85358 138544 150 10 15.00
85358 210275 150 10 15.00
85358 121693 150 10 15.00
85358 210261 150 10 15.00
85358 154615 150 10 15.00
85358 138544 155 11 14.09
85358 210264 155 11 14.09
85358 210261 155 11 14.09
85358 121693 155 11 14.09
85358 210275 155 11 14.09
85358 154615 155 11 14.09
85358 210272 155 11 14.09
85358 171304 155 11 14.09
85358 156498 155 11 14.09
85358 138547 155 11 14.09
85358 222431 155 11 14.09
Так что да, distinct
представляет количество различных / уникальных id_2
, связанных с каждым id_1
и cost
в то время как calc
это просто cost/distinct
.
Я уверен, что это связано с какой-то функцией разделения, но все, что я пробовал до сих пор, не будет работать.