Подмножество файла данных HRS в R - PullRequest
0 голосов
/ 13 марта 2019

У меня есть набор данных, содержащий информацию о решении людей выйти на пенсию. Мне нужно удалить людей, которые вернулись с пенсии на рабочую силу.

Человек уходит на пенсию, если 1) r (i) lbrf = 5 или 2), если r (i) lbrf = 4 и r (i) jhours <= 20, где i = 1,2,3, ... 12 </p>

Физическое лицо не выходит на пенсию, если 1) r (i) lbrf = 1,2,3 или 2) r (i) lbrf = 4 и r (i) jhours> 20.

Мои данные выглядят следующим образом (для удобства я поместил два столбца друг под другом в краску - один - это отработанные часы, другой - состояние рабочей силы = 1,2,3,4,5,6,7).

1: полный рабочий день 2: работа неполный рабочий день 3: безработный 4: частично на пенсии 5: в отставке 6: отключено 7: Не в составе рабочей силы

enter image description here

Мне удобнее всего использовать функцию subset. Я пытался сделать это сам, но мне это не удалось. Я начал так (но я знаю, что не могу использовать такой набор команд)

HRSdata <- subset(HRSdata, ((r1lbrf == 4 & r1jhours <= 20) | r1lbrf == 5 ) & (r2lbrf == 1 | r2lbrf == 2 | r2lbrf == 3 ) |( r3lbrf == 1 | r3lbrf == 2 | r3lbrf == 3) | (r4... and so on and so on)

и это был только первый год, поэтому с 1 по 12. Далее мне нужно было сделать 2 - 12, затем 3 - 12 и так далее. Также, так как я использовал подмножество, я бы оставил только те, у которых r1lbrf == 5 и r1lbrf == 4 & r1ljhours <= 20 </strong>, что противоположно, если это предусмотрено. Я хочу УДАЛИТЬ этих людей, которые вернулись к рабочей силе, а не оставлять их

...