gtrendsR geo MSA / телефонный код - PullRequest
0 голосов
/ 13 мая 2018

Я собираю данные Google Trends с помощью пакета R gtrendsR. Я пытаюсь получить данные для каждой столичной статистической области (MAS), но код области также будет хорошим. Пока мне удалось получить данные только на уровне штата. Вот код для этого.

example <- gtrends("car", geo="US-FL")$interest_over_time 

Я пробовал следующее для MSA:

example2 <- gtrends("car", geo="US-FL-Jacksonville FL")$interest_over_time 

и для кодов городов:

example3 <- gtrends("car", geo="US-FL-904")$interest_over_time 

Я получаю сообщения о том, что пакет не может получить действительные коды. В данных («странах»), связанных с пакетом, коды предназначены только для уровня штата - например, США-Флорида для Флориды.

Мне было бы интересно узнать, как я могу получить более детальные данные с помощью этого пакета, в соответствии с инструкциями, приведенными в примере 2 и примере 3 выше.

1 Ответ

0 голосов
/ 13 мая 2018

Чтобы получить данные для "Джексонвилль, Флорида", вы должны использовать geo = "US-FL-561":

example2 <- gtrends("car", geo = "US-FL-561")$interest_over_time

Чтобы найти геокод для городов, вы можете использовать этот код (вы можете заменить "US-FL" налюбой код страны, который вы хотите):

data("countries")
codes <- unique(countries$sub_code[substr(countries$sub_code, 1,5) == "US-FL"])
codes

#[1] US-FL     US-FL-571 US-FL-592 US-FL-561 US-FL-528 US-FL-534 US-FL-656 US-FL-539 US-FL-548 US-FL-530

countries[countries$sub_code %in% codes[2:length(codes)],]

#       country_code  sub_code                                name
#122665           US US-FL-571                Ft. Myers-Naples, FL
#122666           US US-FL-592                     Gainesville, FL
#122667           US US-FL-561                    Jacksonville, FL
#122668           US US-FL-528            Miami-Ft. Lauderdale, FL
#122670           US US-FL-534 Orlando-Daytona Beach-Melbourne, FL
#122671           US US-FL-656                     Panama City, FL
#122672           US US-FL-539  Tampa-St Petersburg (Sarasota), FL
#122673           US US-FL-548      West Palm Beach-Ft. Pierce, FL
#122680           US US-FL-530     Tallahassee, FL-Thomasville, GA

Функция

Если проще, вы также можете написать код в виде функции:

city_code <- function(geo){
  codes <- unique(countries$sub_code[substr(countries$sub_code, 1,5) == geo])
  if(length(codes) > 1){
    countries[countries$sub_code %in% codes[2:length(codes)], 2:3]
  } else{
    message('No city code for this geo')
  }
}

Примеры

city_code("US-AL")

#        sub_code                                        name
#122636 US-AL-630                              Birmingham, AL
#122637 US-AL-606                                  Dothan, AL
#122638 US-AL-691           Huntsville-Decatur (Florence), AL
#122639 US-AL-698                      Montgomery (Selma), AL
#122669 US-AL-686 Mobile, AL-Pensacola (Ft. Walton Beach), FL

city_code("US-CA")

#        sub_code                                          name
#122649 US-CA-800                               Bakersfield, CA
#122650 US-CA-868                             Chico-Redding, CA
#122651 US-CA-802                                    Eureka, CA
#122652 US-CA-866                            Fresno-Visalia, CA
#122653 US-CA-803                               Los Angeles, CA
#122654 US-CA-828                          Monterey-Salinas, CA
#122655 US-CA-804                              Palm Springs, CA
#122656 US-CA-862               Sacramento-Stockton-Modesto, CA
#122657 US-CA-825                                 San Diego, CA
#122658 US-CA-807            San Francisco-Oakland-San Jose, CA
#122659 US-CA-855 Santa Barbara-Santa Maria-San Luis Obispo, CA
...