R Markdown: преобразование объединенных данных сечения в набор данных панели - PullRequest
0 голосов
/ 04 декабря 2018

В настоящее время я пытаюсь преобразовать набор данных поперечного сечения в набор данных панели.В настоящее время у меня есть переменная с именем «состояние» и переменная с именем «год».Я хотел бы перестроить наблюдения так, чтобы они отображались для каждого штата в год, а числа отображали средние значения других переменных (например, дохода) на штат в год соответственно.У кого-нибудь есть идеи, как мне поступить?

Заранее большое спасибо!

1 Ответ

0 голосов
/ 04 декабря 2018

Если я правильно понимаю ваш вопрос.Код ниже должен помочь.Полезно с вопросами добавить небольшой примерный набор данных и желаемый результат.

В этом ответе используется пакет dplyr

library(dplyr)

Пример данных:

data <- tibble(state = c("florida", "florida", "florida", 
                      "new_york", "new_york", "new_york"),
               year = c(1990, 1990, 1992, 1992, 1992, 1994), 
               income = c(19, 13, 45, 34, 66, 34))

Для получения:

# A tibble: 6 x 3
  state     year income
  <chr>    <dbl>  <dbl>
1 florida   1990     19
2 florida   1990     13
3 florida   1992     45
4 new_york  1992     34
5 new_york  1992     66
6 new_york  1994     34

Код для суммирования данных (используя пакет dplyr)

data %>%
  group_by(state, year) %>%
  summarise(
    mean_income = mean(income)
  )

Создает этот вывод:

# A tibble: 4 x 3
# Groups:   state [?]
  state     year mean_income
  <chr>    <dbl>       <dbl>
1 florida   1990          16
2 florida   1992          45
3 new_york  1992          50
4 new_york  1994          34
...