Наблюдения за выборкой по странам в R - PullRequest
0 голосов
/ 29 апреля 2020

Допустим, у меня есть фрейм данных (df), который состоит из 4000 наблюдений, которые структурированы следующим образом:

Country | Date | Log_GDP | Log_DMSP | Log_Population. 

Каждая страна появляется в фрейме данных несколько раз, поскольку это панельные данные. Как бы я go о выборке 200 случайных стран из этого кадра данных, чтобы они могли быть переданы в функцию lm (), которая выглядит следующим образом?

lm(Log_GDP ~ 1 + Log_Population + Log_DMSP+as.factor(Date),data=sampled_df)

Ответы [ 2 ]

1 голос
/ 29 апреля 2020

Вы можете использовать функцию sample для стран

rand_countries <- sample(unique(df$Country), size = 200, replacement = FALSE), ] 

и выбрать эти значения из кадра данных

sampled_df <- df[df$Country %in% rand_countries, ]
0 голосов
/ 29 апреля 2020

Я думаю, вы говорите о стратифицированной выборке.

В вашем случае вам нужна стратифицированная выборка по столбцу "страна".

см.

Как создать стратифицированную выборку по состоянию в R

...