У меня есть фрейм данных с несколькими столбцами, 4 из которых car
, company_name
, id
и status
.Каждый car
имеет ассоциированные company_name
и status
, а каждый company_name
связан с уникальным ID
.Одним из возможных состояний является Rented
, и я пытаюсь подсчитать количество Rented
автомобилей для каждой компании (в новом столбце под названием # Rented Cars), и я пытаюсь использовать их уникальные идентификаторы для этого.
Я попытался использовать groupby
и применить, но безуспешно.
df['# of Rented Cars'] = df.groupBy('unique_id')['status'].apply(lambda x: (x=='Rented').sum())
Используя в качестве примера следующую таблицу, вы можете увидеть нужные значения в столбце # арендуемых автомобилей:
Но используя приведенный выше код, я просто получаю значение Nan для всех значений в последнем столбце.