групповой с маскированием значения - PullRequest
1 голос
/ 19 октября 2019

У меня есть история имен набора данных, содержащая столбцы: год, регион, количество проданных товаров
, и я хотел бы знать, в каком регионе продано товаров выше, чем среднее количество проданных товаров в этом году, мой код выглядит как

         (history['region','year','item sold'].group-by(['year','region']).mean()))

Я хотел бы замаскировать, чтобы во всех регионах средняя стоимость проданного товара была выше, чем среднее значение года как среднее значение по региону для региона

1 Ответ

0 голосов
/ 19 октября 2019

Вот псевдо-код, как вы можете сделать это с помощью лямбда-функции. Лямбда-функция будет фильтровать строки группы, у которых значение «продано предметом» больше, чем среднее значение для этой группы

history['region','year','item sold'].groupby(['year','region']).apply(lambda g:\
g[g['item sold']>g['item sold'].mean()])
...