Отрицание команды "% in%" - PullRequest
       38

Отрицание команды "% in%"

0 голосов
/ 04 сентября 2018

У меня есть набор данных с географическими данными, и я работаю над разделением на регионы. Есть ряд случайных городов и стран за границей, которые я надеюсь поместить в международную базу данных. Я создал код, чтобы сделать это, но это кропотливо и долго. Мне просто нужен код, чтобы найти все значения НЕ в любом из 7 других региональных фреймов данных, которые я создал.

{r} table(AdmitsCleaned$State)

 AE             Ajman             Anhui         Ar Riyadh 
                2                 1                 1                 1 
               AS                AZ           Ba Dinh           Beijing 
                1                14                 1                 2 
               CA Casablanca-Settat   Central Visayas             Chiba 
               70                 1                 1                 1 
               CO                CT                DC                DE 
               10                28                 7                20 
            Delhi Distrito Nacional                FL           Fukuoka 
                1                 4                12                 1 
               GA           Gujarat          Gyeonggi            Ha Noi 
                7                 2                 1                 1 
            Hanoi             Henan                HI             Hyogo 
                1                 1                 1                 2 
               IA                IL                IN             Iwate 
                1                21                 7                 1 
        Jeonrabuk           Jiangsu           Jiangxi          Kanagawa 
                1                 1                 1                 2 
        Karnataka         Kathmandu            Kerala                KY 
                1                 1                 1                 1 
               LA          Lalitpur          Lam Dong                MA 
                2                 1                 1                29 
           Madrid       Maharashtra                MD                ME 
                1                 8               123                 8 
               MI                MN                MO           Nairobi 
                4                 5                 4                 1 
               NC                ND                NH           Nicosia 
               14                 1                 9                 1 
               NJ                NM                NV                NY 
              123                 4                 4               122 
             OGUN                OH                OK                OR 
                1                17                 2                10 
            ouest        Overijssel                PA            Punjab 
                1                 1               795                 2 

^ Это обзор переменной State.

Ниже приведены регионы, которые я создал:

{r} Southwest_df = c("AZ" , "OK" , "NM" , "TX") sum(AdmitsCleaned$State %in% Southwest_df) {r} Midwest_df = c("WI" , "IA" , "IN" , "ND" , "IL" , "MI" , "OR" , "MN" , "OH") sum(AdmitsCleaned$State %in% Midwest_df) и т.д ....

А для иностранных студентов я должен был указать каждое уникальное значение вручную: {Г}

International_df = c("Ajman" , "Anhui", "Ar Riyadh" , "Ba Dihn" , "Beijing" , "Casablanca-Settat" , "Central Visayas" , "Chiba" , "Delhi" , "Distrito Nacional" , "Fukuoka" , "Gujarat" , "Gyeonggi" , "Ha Nai" , "Hanoi" , "Henan" , "Hyogo" , "Iwate" , "Jeonrabuk" , "Jiangsu" , "Jiangxi" , "Kanagawa" , "Karnataka" , "Kathmandu" , "Kerale" , "Laltipur" , "Lam Dong" , "Madrid" , "Maharashtra" , "Nairobi" , "Nicosia" , "OGUN" , "ouest" , "OVerjissel" , "Punjab" , "Rajasthan" , "Seoul" , "Sichuan" , "Thai Nguyen")
sum(AdmitsCleaned$State %in% International_df)

Есть ли лучший способ сделать это?

...