Я работаю над количеством случаев смерти COVID-19 по штатам и выясняю, способствует ли высокий уровень населения в штате более высокой вероятности смерти от тех, кто поймал COVID-19.
В настоящее время я работаю над разделением моего фрейма данных на две группы, но, как я настрою, это разделение будет зависеть от двух факторов, а не только от одного - например. highpopulation_highdeath (это означает, что население штата больше, чем медиана, а уровень смертности больше, чем медиана), а другой группой будет highpopulation_lowdeath (население штата, которое больше медианы, а уровень смертности меньше, чем медиана). Текущий код приведен ниже, но я получаю неверную синтаксическую ошибку. Поэтому мне интересно, если вы не можете разделить фрейм данных на две группы на основе двух переменных?
Разделить набор данных deaths_to_case на две группы
highpop_highdeath = df.iloc[(df'StatePopulation' > 4342705.0), (df'deaths_to_cases' > 0.012143070253953211).values]
highpop_highdeath.name = 'States with a high population and high death rate'
highpop_lowdeath = df.iloc[(df'StatePopulation'> 4342705.0), (df'deaths_to_cases' <= 0.012143070253953211).values]
highpop_lowdeath.name = 'States with a high population and low death rate'