TB_data_EMR = TB_data[TB_data["g_whoregion"] == "EMR"]
e_inc_num_by_EMRyear = []
for x in list_of_years:
def data_by_year(x):
TB_data_EMRyear = TB_data_EMR[TB_data_EMR["year"]==x]
return TB_data_EMRyear["e_inc_num"].sum()
e_inc_num_by_EMRyear.append(data_by_year(x))
Мне нужно повторить этот код для всех категорий в моем столбце «g_whoregion
». Есть ли хороший способ создать функцию для выполнения sh этой задачи, вместо того, чтобы повторно набирать код и просто подставлять различные имена категорий, как показано ниже:
TB_data_AFR = TB_data[TB_data["g_whoregion"] == "AFR"]
e_inc_num_by_AFRyear = []
for x in list_of_years:
def data_by_year(x):
TB_data_AFRyear = TB_data_AFR[TB_data_AFR["year"]==x]
return TB_data_AFRyear["e_inc_num"].sum()
e_inc_num_by_AFRyear.append(data_by_year(x))
В идеале мне бы понравился фрейм данных, который содержит общее количество «e_inc_num
» (инцидентных случаев) на «year
» для каждого региона в «g_whoregion
», если это имеет смысл, но я не знаю, как это сделать sh. Моя конечная цель - создать линейный график, показывающий заболеваемость в заданный год для каждого региона.