Поэтому я хочу отбросить любую строку, в которой активы меньше (100) или меньше 100 в продажах (продаже) или если отсутствует значение emp, sale или at.
После этого я хочу найти среднюю занятость (emp) на одну фирму в США (loc == "США), которая была указана в любое время за годы (год) с 2010 по 2013 год включительно.
Покафирма указана в тот период времени вообще, я хочу включить ее в расчет Как я могу сохранить всю группу, даже если в одной строке есть год с 2010 по 2013 год?
Уникальный идентификатор фирмы - gvkey.
Вот что у меня сейчас:
companies_q_three <- companies %>%
filter(at >= 100 | sale >= 100) %>%
filter(!is.na(sale), !is.na(emp), !is.na(at)) %>%
filter (loc == "USA") %>%
group_by(gvkey) %>%
filter(fyear >= 2010 & fyear <= 2013) %>%
summarise(companies_q_three = mean(emp, na.rm=TRUE))