несколько критериев для подмножества выборки - R - PullRequest
1 голос
/ 11 октября 2019

Уважаемые пользователи Stackoverflowers R,

Я пытаюсь установить подмножество моего образца на основе 3 критериев. Я пытаюсь записать образец кадра данных:

Name       Name2       Gender Thus_o
Mariana    Valentina   woman      
Valentina  Valentina   woman  Mela
Valentina  Valentina   woman
Mariana    Valentina   man
Valentina  Valentina   man
Valentina  Valentina          Mela

Следующие три являются моими критериями поднабора.

#1
dataframe1<- subset(dataframe1, Name == Name2) # keep if name is the same as name2

#2
dataframe1<- subset(dataframe1, Name != "Mariana " &
                          Gender!= "man" |
                          Name != "Valentina " &
                          Gender != "man")  # keep all of the observations except those for whom the name differs from Mariana and the gender is reported to differ from man or those for whom the name differs from Valentina and the gender is reported to differ from man (i.e. drop if there is female name but the reported gender is man)

#3
dataframe1<- subset(dataframe1, Gender== "" & Thus_o!="")  # drop if Gender is empty and Thus_o is not empty (I do not know if it matters but notices that Gender is not "NA", it is empty and it has to be so for a specific reason)

Первый критерий поднабора работает хорошо (я выполняю кусочно скрипт), но критерий 2 не работает должным образом, и после запуска критерия 3 мой фрейм данных становится пустым!

Что я делаю не так и как он может получить ожидаемый результат?

Мое подмножество должно вернуть мне одно наблюдение:

Name       Name2       Gender Thus_o
Valentina  Valentina   woman  Mela

ПРИМЕЧАНИЕ: Я пытался разложить критерий 2 следующим образом, но результаты остались прежними:

#2.a
dataframe1<- subset(dataframe1, Name != "Mariana " &
                          Gender!= "man")
#2.b
dataframe1<- subset(dataframe1, 
                          Name != "Valentina " &
                          Gender != "man")
...