GTrends Location Mistmatch к шейп-файлам переписи США - PullRequest
0 голосов
/ 21 мая 2018

Я пытаюсь связать данные из Google Trends с данными геокодирования из переписи.Это пример данных о местоположении, предоставленных Google Trends для Флориды:

 sub_code                           name
US-FL-571                    Ft. Myers-Naples, FL
US-FL-592                         Gainesville, FL
US-FL-561                        Jacksonville, FL
US-FL-528                Miami-Ft. Lauderdale, FL
US-FL-534     Orlando-Daytona Beach-Melbourne, FL
US-FL-656                         Panama City, FL

Более подробную информацию об этом выводе можно найти здесь .

С здесь , можно скачать шейп-файлы MSA.Я скачал данные CBSA за 2017 год с разрешением 20м.Вот соответствующие данные для Флориды:

 [1] "Wauchula, FL"                             
 [2] "Deltona-Daytona Beach-Ormond Beach, FL"   
 [3] "Port St. Lucie, FL"                       
 [4] "Arcadia, FL"                              
 [5] "Punta Gorda, FL"                          
 [6] "Sebring, FL"                              
 [7] "Homosassa Springs, FL"                    
 [8] "Key West, FL"                             
 [9] "Sebastian-Vero Beach, FL"                 
[10] "Tampa-St. Petersburg-Clearwater, FL"      
[11] "Crestview-Fort Walton Beach-Destin, FL"   
[12] "Okeechobee, FL"                           
[13] "Jacksonville, FL"                         
[14] "Tallahassee, FL"                          
[15] "Orlando-Kissimmee-Sanford, FL"            
[16] "Miami-Fort Lauderdale-West Palm Beach, FL"
[17] "Gainesville, FL"                          
[18] "The Villages, FL"                         
[19] "Palatka, FL"                              
[20] "Lakeland-Winter Haven, FL"                
[21] "Lake City, FL"                            
[22] "Ocala, FL"                                
[23] "North Port-Sarasota-Bradenton, FL"        
[24] "Pensacola-Ferry Pass-Brent, FL"           
[25] "Cape Coral-Fort Myers, FL"                
[26] "Naples-Immokalee-Marco Island, FL"        
[27] "Palm Bay-Melbourne-Titusville, FL"        
[28] "Clewiston, FL"                            
[29] "Panama City, FL" 

Я понимаю, что у Gtrends есть подмножество всех возможных MSA, но в то время как некоторые идеально совпадают (например, Панама Сити, Флорида), для других не очень ясно, что должнослиться с чем.Например, Ft.Myers-Naples, FL из первых данных может быть объединен с Cape Coral-Fort Myers, FL или с Naples-Immokalee-Marco Island, FL.

Буду признателен за любые указания по устранению таких несоответствий.Возможно, я упускаю что-то очевидное, поэтому, если вы заметите это, было бы здорово узнать!

...