Переименовать столбец на основе другого значения столбца - PullRequest
0 голосов
/ 31 мая 2018

У меня есть фрейм данных со следующими столбцами:

Region | LA code | LA Name
-----------------------------------------
London |    201  | City of London
London |    202  | Camden
London |    203  | Greenwich
London |    204  | Hackney
London |    205  | Hammersmith and Fulham
London |    206  | Islington
London |    207  | Kensington and Chelsea
London |    208  | Lambeth
London |    209  | Lewisham
London |    210  | Southwark
London |    211  | Tower Hamlets
London |    212  | Wandsworth
London |    213  | Westminster
London |    301  | Barking and Dagenham
London |    302  | Barnet
London |    303  | Bexley
London |    304  | Brent
London |    305  | Bromley
London |    306  | Croydon
London |    307  | Ealing
London |    308  | Enfield
London |    309  | Haringey
London |    310  | Harrow
London |    311  | Havering
London |    312  | Hillingdon
London |    313  | Hounslow
London |    314  | Kingston upon Thames
London |    315  | Merton
London |    316  | Newham
London |    317  | Redbridge
London |    318  | Richmond upon Thames
London |    319  | Sutton
London |    320  | Waltham Forest

Мой вопрос заключается в том, как быстро и просто переименовать Лондон во Внутренний Лондон, где код LA находится в диапазоне 201 - 213, и переименовать.От Лондона до Внешнего Лондона, где код LA находится в диапазоне 301 - 320?

Спасибо.

Ответы [ 2 ]

0 голосов
/ 31 мая 2018

Используя np.select, вы можете указать список условий и значений:

df = pd.DataFrame([['London', 201, 'City of London'],
                   ['London', 302, 'Barnet']],
                  columns=['Region', 'LA Code', 'LA Name'])

conditions = [df['LA Code'].between(201, 213), df['LA Code'].between(301, 320)]

values = ['Inner ' + df['Region'], 'Outer ' + df['Region']]

df['Region'] = np.select(conditions, values, df['Region'])

print(df)

         Region  LA Code         LA Name
0  Inner London      201  City of London
1  Outer London      302          Barnet

Обратите внимание, что последний аргумент для np.select является аргументом по умолчанию, который используется, когда ни одно из предоставленных условий не применимо.

0 голосов
/ 31 мая 2018

На оба вопроса отвечают pd.Series.between.

m = df['LA Code'].between(201, 213)
df.loc[m, 'Region'] = 'Inner ' + df.loc[m, 'Region']
# df.loc[m, 'Region'] = df.loc[m, 'Region'].radd('Inner ')

И,

m = df['LA Code'].between(301, 320)
df.loc[m, 'Region'] = 'Outer ' + df.loc[m, 'Region']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...