Почему я получаю «NA» только для результатов при фильтрации переменной в моем наборе данных? - PullRequest
0 голосов
/ 04 мая 2019

Я пытаюсь отфильтровать набор данных wooldridge gpa1, поэтому job19 показывает только наблюдения, где было выполнено 19 часов. Я выполнил команду

library(wooldridge)
filter(gpa1, job19 == 1) 

чтобы увидеть все случаи, когда job19 == 1, и все наблюдения появились как NA. Кто-нибудь знает, почему это так? Ранее я смотрел переменную gpa1, а job19 - фиктивная переменная, поэтому все наблюдения перечислены как 1 или 0, поэтому у меня должны быть результаты, верно? Я также пытался отфильтровать случаи, когда job19 == 0, но получил те же результаты.

1 Ответ

0 голосов
/ 04 мая 2019

Econ465, просто загрузите пакеты и правильно используйте их функции.

library(wooldridge)
library(dplyr)
data("gpa1")
# View(gpa1)

df <- gpa1 %>% 
  dplyr::filter(job19 == 1) 
head(df, 10)

> head(df, 10)
   age soph junior senior senior5 male campus business engineer colGPA hsGPA ACT job19 job20 drive bike walk voluntr PC greek car siblings bgfriend
1   20    0      1      0       0    0      0        1        0    3.0   3.6  26     1     0     0    0    1       0  0     0   1        1        0
2   19    1      0      0       0    1      1        1        0    3.5   3.5  27     1     0     0    0    1       0  0     0   0        1        0
3   22    0      0      0       1    0      0        0        0    2.7   3.0  22     1     0     1    0    0       0  1     0   0        1        1
4   22    0      0      0       1    0      0        0        0    2.7   3.0  21     1     0     1    0    0       0  0     0   1        1        1
5   19    1      0      0       0    0      0        1        0    3.8   4.0  27     1     0     0    0    1       0  1     0   0        1        0
6   21    0      0      1       0    1      0        1        0    2.8   3.0  19     1     0     0    0    1       0  0     0   1        1        1
7   21    0      0      1       0    0      1        1        0    3.0   3.5  23     1     0     0    0    1       0  1     0   1        1        1
8   20    0      1      0       0    0      0        1        0    2.6   3.5  25     1     0     1    0    0       0  0     1   1        1        1
9   22    0      0      1       0    1      0        0        1    2.7   3.0  23     1     0     0    0    1       0  0     0   1        1        0
10  21    0      0      1       0    0      1        0        0    3.0   4.0  25     1     0     0    1    0       1  1     1   1        1        1
   clubs skipped alcohol gradMI fathcoll mothcoll
1      1     0.0    1.00      1        1        1
2      0     0.0    0.00      0        0        0
3      0     3.0    3.00      1        1        1
4      1     2.0    2.50      1        1        1
5      1     0.5    0.75      1        0        1
6      0     2.0    1.00      1        0        0
7      1     0.0    1.00      1        0        1
8      1     3.0    2.00      1        1        1
9      1     1.0    1.00      1        0        1
10     1     0.0    0.00      1        0        0

См. Ссылку ниже.

Функция фильтра в dplyr в R не работает

...