У меня есть набор данных с географическими данными, и я работаю над разделением на регионы. Есть ряд случайных городов и стран за границей, которые я надеюсь поместить в международную базу данных. Я создал код, чтобы сделать это, но это кропотливо и долго. Мне просто нужен код, чтобы найти все значения НЕ в любом из 7 других региональных фреймов данных, которые я создал.
{r}
table(AdmitsCleaned$State)
AE Ajman Anhui Ar Riyadh
2 1 1 1
AS AZ Ba Dinh Beijing
1 14 1 2
CA Casablanca-Settat Central Visayas Chiba
70 1 1 1
CO CT DC DE
10 28 7 20
Delhi Distrito Nacional FL Fukuoka
1 4 12 1
GA Gujarat Gyeonggi Ha Noi
7 2 1 1
Hanoi Henan HI Hyogo
1 1 1 2
IA IL IN Iwate
1 21 7 1
Jeonrabuk Jiangsu Jiangxi Kanagawa
1 1 1 2
Karnataka Kathmandu Kerala KY
1 1 1 1
LA Lalitpur Lam Dong MA
2 1 1 29
Madrid Maharashtra MD ME
1 8 123 8
MI MN MO Nairobi
4 5 4 1
NC ND NH Nicosia
14 1 9 1
NJ NM NV NY
123 4 4 122
OGUN OH OK OR
1 17 2 10
ouest Overijssel PA Punjab
1 1 795 2
^ Это обзор переменной State.
Ниже приведены регионы, которые я создал:
{r}
Southwest_df = c("AZ" , "OK" , "NM" , "TX")
sum(AdmitsCleaned$State %in% Southwest_df)
{r}
Midwest_df = c("WI" , "IA" , "IN" , "ND" , "IL" , "MI" , "OR" , "MN" , "OH")
sum(AdmitsCleaned$State %in% Midwest_df)
и т.д ....
А для иностранных студентов я должен был указать каждое уникальное значение вручную:
{Г}
International_df = c("Ajman" , "Anhui", "Ar Riyadh" , "Ba Dihn" , "Beijing" , "Casablanca-Settat" , "Central Visayas" , "Chiba" , "Delhi" , "Distrito Nacional" , "Fukuoka" , "Gujarat" , "Gyeonggi" , "Ha Nai" , "Hanoi" , "Henan" , "Hyogo" , "Iwate" , "Jeonrabuk" , "Jiangsu" , "Jiangxi" , "Kanagawa" , "Karnataka" , "Kathmandu" , "Kerale" , "Laltipur" , "Lam Dong" , "Madrid" , "Maharashtra" , "Nairobi" , "Nicosia" , "OGUN" , "ouest" , "OVerjissel" , "Punjab" , "Rajasthan" , "Seoul" , "Sichuan" , "Thai Nguyen")
sum(AdmitsCleaned$State %in% International_df)
Есть ли лучший способ сделать это?