Я импортировал два набора данных в свой блокнот.Тот, который состоит из имен, которые были даны ребенку для каждого штата в каждом году (и число, [количество] его).Другой состоит из общего числа людей в США с таким именем и конкретным именем.(см. добавленные изображения).
Проблема в том, что я добавил два набора данных, чтобы они стали одним набором данных, поскольку слияние и concat не работали.
Я хочу создать столбец «Totalcount» рядом со всеми столбцами, в которых также упоминается штат (не NAN), чтобы я мог сравнивать детские имена с национальным счетом этого конкретного имени для каждого штата.
Например: в 1934 году 4 ребенка были названы «Анна» в Техасе.Количество людей по имени «Анна» в США составляло 14000 в 1934 году. Тогда число «общего количества» должно было составить 14000.Это число должно быть 14000 и для других штатов.Итак: 5 детей были названы «Анна» в Калифорнии, и общее количество все равно будет 14000. Я пробовал много вещей, но я не могу понять это.
Набор данных, приведенный выше:национальный подсчет имен в каждом году, но без штатов.В разделе: подсчет определенных детских имен, которые даны в каждом штате, я добавил эти два набора данных, так как объединение или concat не работали.
пример набора данных состояний:
df = pd.DataFrame([['AF',1910.0, 'F', 'Mary', 14.0], ['TX',1910.0, 'M' , 'Lex', 15.0], ['CA',1920.0,'M','Tom', 14.0]], columns=['State', 'Sex','Year','Name','Count'])
пример набора национальных данных:
df2 = pd.DataFrame([['Anna','F', 2402,1910], ['Ben','M',5044,1912], ['Simon','M',39203,1910]], columns=['Name', 'Sex','Count','Year'])
df2