Заполнение пропущенных дат и добавление «0» - PullRequest
0 голосов
/ 29 марта 2019

Приведенный ниже код показывает количество лавин в SLC за каждый год-месяц в течение лыжного сезона (декабрь-март). Поскольку этот код получает итоговое значение каждый год-месяц, он не добавляется к годам-месяцам, в которых было 0 лавин. Как мне заполнить свою таблицу, чтобы она содержала весь год-месяц?

# write the webscraper
for(page in all.pages){
  this.url<-paste(avalanche.url, page, sep="")
  thispage.avalanche<-readHTMLTable(this.webpage, which=1, header=T,stringsAsFactors=F)

# subset the data to the Salt Lake Region
avalancheslc<-subset(avalanche, Region=="Salt Lake")

# convert the dates and get the  total the number of avalanches
avalancheslc <- avalancheslc %>% 
          group_by(Date = format(as.yearmon(Date, "%m/%d/%Y"), "%Y-%m")) %>% 
          summarise(AvalancheTotal = n())
# pipe to only include Dec-Mar of each year
avalancheslc <- avalancheslc %>% filter(as.integer(substr(Date, 6, 7)) %in% c(12, 1:3))
# the data right now looks like this
Date   AvalancheTotal
1980-01        1
1981-02        1

# the data needs to look like this
Date   AvalancheTotal
1980-01        1
1980-02        0
1980-03        0
1980-12        0
1981-01        0
1981-02        1
1981-03        1

1 Ответ

0 голосов
/ 29 марта 2019

# You data here...

# Simpler version
avalancheslc %>%
  separate(Date, c("year", "month")) %>%
  # Some years might be missing (no avalanches at all)
  # We can fill in those with `full_seq` but
  # `full_seq` works with numbers not characters
  mutate(year = as.integer(year)) %>%
  complete(year = full_seq(year, 1), month,
           fill = list(AvalancheTotal = 0)) %>%
  unite("Date", year, month, sep = "-")

# Alternative version (fills in all months, so needs filtering afterwards)

avalancheslc <- avalancheslc %>%
  # In case `Date` needs parsing
  mutate(Date = parse_date_time(Date, "%y-%m"))

# A full data frame of months
all_months <- avalancheslc %>%
  expand(Date = seq(first(Date), last(Date), by = "month"))

# Join to `avalanches` and fill in with 0s
avalancheslc %>%
  right_join(all_months) %>%
  replace_na(list(AvalancheTotal = 0))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.