Как объединить несколько строк на основе другого столбца? - PullRequest
0 голосов
/ 06 ноября 2018

У меня есть следующий фрейм данных:

Postcode    Borough           Neighbourhood
----------------------------------------------
   0        M1B Scarborough   Rouge
   1        M1B Scarborough   Malvern
   2        M1C Scarborough   Highland Creek
   3        M1C Scarborough   Rouge Hill
   4        M1C Scarborough   Port Union

Я хочу объединять записи в столбце Neighbhourhood каждый раз, когда в столбце Postcode есть повторяющаяся запись. Например, при выводе я хочу, чтобы запись «M1B» вводилась только один раз, а «Rouge» и «Malvern» в столбце «Соседство», разделенные запятыми:

Postcode
M1B                           Rouge,Malvern
M1C    Highland Creek,Rouge Hill,Port Union
M1E         Guildwood,Morningside,West Hill
M1G                                  Woburn
M1H                               Cedarbrae

Это вывод, который я сейчас получаю, но это серия, а не датафрейм, и я пропускаю столбец Borough. Я использовал следующий код:

df=dataframe.groupby('Postcode')['Neighbourhood'].apply(','.join)
df.head()

Пожалуйста, помогите мне получить все три столбца в кадре данных, а не в серии.

1 Ответ

0 голосов
/ 06 ноября 2018

Попробуйте это:

df=dataframe.groupby(['Postcode', 'Borough']).Neighbourhood.apply(', '.join).reset_index()
df.head()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...