Я пытаюсь создать новый столбец на основе другого столбца. в частности, если оно содержит определенное значение.
Я сделал следующее:
df['region'] = np.where(df['location'].str.contains("AK| AZ | CA | CO | HI |ID | MT | NM | NV | OR | UT | WA | WY", na=False), "west",
np.where(df['location'].str.contains("PA | NJ | NY | VT | NH | MA | RI | CT | ME", na=False), "northwest",
np.where(df['location'].str.contains("AR | AL | DC | DE | FL | GA | KY | LA | MD | MS | NC | OK | SC | VA | WV", na=False), "south",
np.where(df['location'].str.contains("IA | IL | IN | KS |MI | MN |MO | ND |NE | OH | SD | WI", na=False), "midwest", "international"))))
Я получаю это:
location region
Columbia, MO international
Maplewood, NJ international
ожидается:
location region
Columbia, MO midwest
Maplewood, NJ northwest
У меня в основном есть столбец 'location', я хочу проверить, содержит ли он одно из сокращений, а затем создать новый столбец для региона.
Спасибо!