Python датафрейм, сгруппировать строки по среднему значению и перезаписать часть его значения? - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть датафрейм, который выглядит следующим образом:

userID  movieID unix_timestamp  rating   title      genre   plot    actors  age sex occupation  zip
255     255       884494693       4       My Bes... Comedy  wo...   Abd...  65  M   retired     06518
235     286       884470681       3       The En... Drama   Be...   Bel...  66  F   retired     14518
42      405       884494797       2       Missio... Action  Ba...   Bro...  38  M   Lawyer      75518

Я хотел бы сгруппировать пользователей, вышедших на пенсию, рассчитать среднее значение рейтинга, который они оставили, возраст, пол и почтовый индекс следует заменить на наибольшее количество, назначить новый идентификатор для него.

Таким образом, я хотел бы заменить все строки, в которых занято на пенсию (пенсионеры), новым "пользователем" (агрегированным из пенсионеров).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...