Я борюсь со следующей проблемой. У меня есть набор данных larga с данными, собранными из разных штатов за длительный период времени. Для простоты, в качестве названий штатов мы используем аббревиатуры, то есть «AL» обозначает Алабаму, «AZ» означает Аризона и c. Я создал новый столбец с полными названиями штатов. Мне нужно заполнить его полными именами штатов в соответствии с именами аббревиатур.
Например:
import numpy as np
import pandas as pd
data = [['', 'AL'], ['', 'AL'], ['', 'AZ']]
df1 = pd.DataFrame(data,columns=['full_names','short_names'])
df1
Это генерирует следующий вывод:
full_names short_names
0 AL
1 AL
2 AZ
Я хотел бы иметь в первом столбце Алабама, штат Алабама, Аризона.
Для решения этой проблемы я создал список из 51 полных названий штатов и еще один список с короткими именами (используя unique()
). Как мы можем сопоставить имена? В моем наборе данных более 2000 строк.
Большое спасибо заранее и извинения, если мой вопрос слишком тупой.