У меня есть данные (df), df1 содержит страны с числом заражений во времени (2000+ строк), а df2 содержит страны с численностью населения (200 строк).
Я пытался получить численность населения от df2 до df1, чтобы трансформировать инфекции в плотность инфекции (?) с течением времени.
По-моему, мне приходится перебирать строки df1 и проверять столбец Country для каждого индекса на df2. Если результат True, я могу скопировать население из df2 в df1. Я пробовал несколько подходов (только один ниже), но сейчас я в растерянности: (... может кто-нибудь дать мне пу sh в правильном направлении?
for index, row in df2.iterrows():
df_test = df1['Country'].str.contains(row[0])
Редактировать обновление с помощью df1, df2 и предпочтительный результат: df1
ObservationDate Country/Region Confirmed
0 -2.118978 Hong Kong 0.0
1 -2.118978 Japan 2.0
2 -2.118978 Macau 1.0
3 -2.118978 Mainland China 547.0
4 -2.118978 South Korea 1.0
df2
0 1
0 China 1.401580e+09
1 India 1.359321e+09
2 United States[c] 3.293798e+08
3 Indonesia 2.669119e+08
4 Brazil 2.111999e+08
df_preferred
ObservationDate Country/Region Confirmed Population
0 -2.118978 Hong Kong 0.0
1 -2.118978 Japan 2.0
2 -2.118978 Macau 1.0
3 -2.118978 Mainland China 547.0 1.401580e+09
4 -2.118978 South Korea 1.0