Question

У меня есть фрейм данных с несколькими столбцами, 4 из которых car, company_name, id и status.Каждый car имеет ассоциированные company_name и status, а каждый company_name связан с уникальным ID.Одним из возможных состояний является Rented, и я пытаюсь подсчитать количество Rented автомобилей для каждой компании (в новом столбце под названием # Rented Cars), и я пытаюсь использовать их уникальные идентификаторы для этого.

Я попытался использовать groupby и применить, но безуспешно.

df['# of Rented Cars'] = df.groupBy('unique_id')['status'].apply(lambda x: (x=='Rented').sum())

Используя в качестве примера следующую таблицу, вы можете увидеть нужные значения в столбце # арендуемых автомобилей:

Но используя приведенный выше код, я просто получаю значение Nan для всех значений в последнем столбце.

WeNYoBen · Answer 1 · 15 мая 2019

Я думаю, что вы ищете transform

df['# of Rented Cars'] = df.groupBy('unique_id')['status'].transform(lambda x: (x=='Rented').sum())

или без lambda

df['# of Rented Cars'] = df['status'].eq('Rented').groupBy(df['unique_id']).transform('sum')

Как подсчитать количество строк, которые следуют условию в двух столбцах в пандах, используя Groupby

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как подсчитать количество строк, которые следуют условию в двух столбцах в пандах, используя Groupby

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов