У меня есть данные переписи, показывающие доход домохозяйства в отдельности для определенного региона:
test_data <- data.frame(region = "Pluto",
low = c(1,7800,15600,20800,26000,33800,41600,52000,65000,78000,91000,104000,156000),
high = c(7799,15599,20799,25999,33799,41599,51999,64999,77999,90999,103999,155999,Inf),
households = c(10674,17768,20497,18413,17261,20529,24754,25286,16704,12847,8654,11170,3480))
test_data <- test_data %>% mutate(bin_interval = paste(low, high, sep = " - "))
«низкий» и «высокий» относятся к краям корзины. Я хочу оценить средний доход для этого региона. Для этого мне нужно подогнать дистрибутив для бин-данных. Из этого распределения я могу вычислить среднее значение. Может кто-нибудь показать мне, как это сделать? Спасибо заранее!
Обратите внимание, что у меня много регионов. Данные примера приведены только для одного региона.