Как создать функцию, которая будет возвращать значение в словаре для каждой строки в таблице данных, используя Python? - PullRequest
0 голосов
/ 17 июня 2019

Мне нужно создать новый столбец в моей таблице для области состояния, которая заполняет область для каждой строки данных (каждая из которых имеет состояние). Как написать функцию для вызова словаря для каждого элемента строки?

У меня есть около 30 000 элементов строки, и я считаю, что цикл займет слишком много времени. Я уверен, что есть какой-то способ сделать это с помощью словарей. Я пытался использовать разные методы для вызова этого, но не могу заставить его заполнить правильные данные.

states = {
        'AK': 'Alaska',
        'AL': 'Alabama',
        'AR': 'Arkansas',
        'AZ': 'Arizona',
        'CA': 'California',
        'CO': 'Colorado',
        'CT': 'Connecticut',
        'DC': 'District of Columbia',
        'DE': 'Delaware',
        'FL': 'Florida',
        'GA': 'Georgia',
        'HI': 'Hawaii',
        'IA': 'Iowa',
        'ID': 'Idaho',
        'IL': 'Illinois',
        'IN': 'Indiana',
        'KS': 'Kansas',
        'KY': 'Kentucky',
        'LA': 'Louisiana',
        'MA': 'Massachusetts',
        'MD': 'Maryland',
        'ME': 'Maine',
        'MI': 'Michigan',
        'MN': 'Minnesota',
        'MO': 'Missouri',
        'MS': 'Mississippi',
        'MT': 'Montana',
        'NC': 'North Carolina',
        'ND': 'North Dakota',
        'NE': 'Nebraska',
        'NH': 'New Hampshire',
        'NJ': 'New Jersey',
        'NM': 'New Mexico',
        'NV': 'Nevada',
        'NY': 'New York',
        'OH': 'Ohio',
        'OK': 'Oklahoma',
        'OR': 'Oregon',
        'PA': 'Pennsylvania',
        'RI': 'Rhode Island',
        'SC': 'South Carolina',
        'SD': 'South Dakota',
        'TN': 'Tennessee',
        'TX': 'Texas',
        'UT': 'Utah',
        'VA': 'Virginia',
        'VT': 'Vermont',
        'WA': 'Washington',
        'WI': 'Wisconsin',
        'WV': 'West Virginia',
        'WY': 'Wyoming'
}

state_abbrev = {v: k for k, v in states.items()}

state_code = {
    'AK': '10','AL': '4', 'AR': '9', 'AR': '6', 'CA': '9', 'CO': '8',  'CT': '1', 'DC': '3', 'DE': '3', 'FL': '4',
'GA': '4', 'HI': '9', 'IA': '7', 'ID': '10', 'IL': '5', 'IN': '5', 'KS': '7', 'KY': '4', 'LA': '6', 
'MA': '1', 'MD': '3', 'ME': '1', 'MI': '5', 'MN': '5','MO': '7', 'MS': '4', 'MT': '8', 'NC': '4', 
'ND': '8', 'NE': '7', 'NH': '1', 'NJ': '2', 'NM': '6','NV': '9', 'NY': '2', 'OH': '5', 'OK': '6', 
'OR': '10', 'PA': '3', 'PR': '2', 'RI': '1', 'SC': '4', 'SD': '8', 'TN': '4', 'TX': '6', 'UT': '8',
'VA': '3', 'VI': '2', 'VT': '1', 'WA': '10', 'WI': '5', 'WV': '3', 'WY': '8', 'PI': '9'
    }

state_region = {v: k for k, v in state_code.items()}

def get_region (): вернуть [state_region [i] для i в полном формате ['state']]

fulldf ["Region"] = get_region () fulldf.tail ()

Возвращает ключевую ошибку «MA», которая, как ожидается, вернет новый столбец с именем «Регион», который заполняет регион для каждого из перечисленных «состояний».

KeyError                                  Traceback (most recent call last)
<ipython-input-338-6afc1e48556a> in <module>
 33     return [state_region[i] for i in fulldf['state']]
 34 
---> 35 fulldf["Region"] = get_region()
 36 fulldf.tail()
 37 

<ipython-input-338-6afc1e48556a> in get_region()
 31 
 32 def get_region():
---> 33     return [state_region[i] for i in fulldf['state']]
 34 
 35 fulldf["Region"] = get_region()

<ipython-input-338-6afc1e48556a> in <listcomp>(.0)
 31 
 32 def get_region():
---> 33     return [state_region[i] for i in fulldf['state']]
 34 
 35 fulldf["Region"] = get_region()

KeyError: 'MA'

1 Ответ

0 голосов
/ 17 июня 2019

Ваша get_region функция некорректна. Должно быть:

def get_region():
    return [state_region[i] for i in fulldf['state']]

Понимание Python достаточно оптимизировано, чтобы эта функция работала для кадра данных длиной 30 тыс.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...