У меня есть следующий фрейм данных:
id created_on operation property_type place_with_parent_names floor rooms expenses price_aprox_local_currency description title table_name days_on_market
59176 172cdc2cdc7f59b9029c0cb758474b4eb39edcd0 2015-01-16 sell house |México|Nuevo León|Monterrey| NaN NaN NaN 5735793.85 Casa en venta en Cumbres 2do. Sector. 3 habita... Casa en Venta en Monterrey 201501 15
64175 f370552ac7e53400d0ffb7ba3624bacace9b5c37 2015-01-05 sell house |México|Baja California|Playas de Rosarito| NaN NaN NaN 3893406.00 Casa con excelente terreno y amplios espacios,... CASA EN VENTA ROSARITO 201501 26
64174 d388b6e389ec6124740fb515fbb950c7197b92c6 2015-01-05 sell house |México|San Luis Potosí|San Luis Potosí| NaN NaN NaN 446984.59 Excelente ubicacióna 6 minutos de Blvd. Rio Sa... PROYECTO: Villas de la Victoria, una PLANTA, ... 201501 26
Я хочу сгруппировать по столбцу place_with_parent_names, а также использовать среднее значение каждой такой группы для заполнения значений NA в моем этаже, комнатах, расходах и столбцах price_aprox_local_currency
Пока у меня есть:
single_price_listings2 = single_price_listings.groupby(["place_with_parent_names"])["floor", "rooms", "expenses", "price_aprox_local_currency", "days_on_market"].mean().transform(lambda x: x.fillna(x.mean()))
Мне возвращают следующее:
floor rooms expenses price_aprox_local_currency days_on_market
59176 4.673260 3.123693 1034.293750 5.735794e+06 15
64175 2.250000 NaN 235.000000 3.893406e+06 26
64174 2.240409 2.992894 1010.000000 4.469846e+05 26
Я думаю, что это, возможно, сработало при заполнении значений NaN, где это возможно, но мне не возвращают объект groupby (). Mean (), и если я пытаюсь добавить .mean () в конце, мне дают одна строка (я предполагаю, что она принимает среднее значение каждого столбца по всему столбцу).