Я хочу заполнить пропущенные значения в одном столбце на основе другого столбца. У меня есть данные с колонкой штатов США и другой с городами. Некоторые записи в городах отсутствуют. Я хочу заполнить эти города в зависимости от города, в котором они находятся. если пропавший город для D C, заполните Вашингтон.
Я пробовал это:
states = ['OH', 'WV', 'CA', 'FL', 'GA', 'SC', 'NE', 'IA', 'IL', 'MO', 'WI',
'IN', 'MI', 'NJ', 'NY', 'CT', 'MA', 'RI', 'NH', 'PA', 'KY', 'MD',
'VA', 'DC', 'DE', 'TX', 'WA', 'OR', 'AL', 'TN', 'NC', 'MN', 'KS',
'OK', 'LA', 'CO', 'UT', 'AZ', 'NM', 'NV', 'VT', 'MS', 'AR', 'MT',
'ME', 'ND', 'WY', 'ID', 'SD']
for state in states:
freq_city = df.loc[lambda df: df['State'] == state]['City'].mode()[0]
for df['State'] in states:
if df['State'] == state:
df['City'].fillna(freq_city,inplace=True)
однако утверждение if неоднозначно и правильно. Просто не знаю, что делать дальше