построение граней временных рядов - PullRequest
0 голосов
/ 05 октября 2018

У меня есть следующий фрейм данных, описывающий короткие периоды сна в течение дня.Вот пример:

    structure(list(starttime = structure(c(1507252170, 1507534980, 
1507523940, 1508901450, 1507254150, 1507775670, 1507603260, 1507708020, 
1507539960, 1508857170, 1507534740, 1507784520, 1508813190, 1507536060, 
1507523160, 1508901870, 1507539840, 1507523520, 1507775640, 1507713660, 
1507782240, 1507254390, 1507612950, 1507623210, 1507595190, 1508819730, 
1508815680, 1507695990, 1508809830, 1508857050, 1507708530, 1508898960, 
1507780860, 1508862510, 1507825860, 1507603830, 1507620630, 1507699950, 
1508899320, 1507825980, 1507607970, 1507533120, 1507790460, 1507597110, 
1508862570, 1508813640, 1507515420, 1507533180, 1507794360, 1507593210, 
1507515360, 1507777710, 1507609710, 1507828440, 1507535040, 1508908470, 
1507623270, 1507607400, 1507535100, 1507791360, 1507524060, 1507620210, 
1507620330, 1507782300, 1507710690, 1508903760, 1507607370, 1507708380, 
1508807400, 1507536000, 1507534800, 1507593030, 1508813160, 1507594230, 
1507791720, 1507791000, 1507515600, 1507620570, 1507515480, 1507356150, 
1508857110, 1507789500, 1507361400, 1507718940, 1507597260, 1507597980, 
1507782630, 1507361760, 1507790580, 1507696290, 1507790490, 1507828260, 
1507613610, 1508085480, 1508085420, 1508899020, 1507606380, 1507828380, 
1507605780, 1507780050), class = c("POSIXct", "POSIXt"), tzone = "UTC"), 
    endtime = structure(c(1507254150, 1507535040, 1507524060, 
    1508901870, 1507254390, 1507777710, 1507603830, 1507708380, 
    1507540260, 1508862510, 1507534800, 1507785450, 1508813640, 
    1507539840, 1507523280, 1508902530, 1507539960, 1507523580, 
    1507775670, 1507718940, 1507782630, 1507257510, 1507613610, 
    1507623270, 1507597110, 1508856990, 1508819730, 1507696110, 
    1508810070, 1508857110, 1507708950, 1508899320, 1507781280, 
    1508862570, 1507825980, 1507604130, 1507620690, 1507700070, 
    1508899440, 1507828080, 1507609710, 1507533180, 1507790490, 
    1507597260, 1508862930, 1508813880, 1507515480, 1507534740, 
    1507797330, 1507593540, 1507515420, 1507780050, 1507610040, 
    1507829820, 1507535100, 1508908890, 1507624710, 1507607790, 
    1507536000, 1507791720, 1507524120, 1507620330, 1507620570, 
    1507782630, 1507711050, 1508903790, 1507607790, 1507708530, 
    1508809530, 1507536060, 1507534860, 1507593210, 1508813190, 
    1507595190, 1507793580, 1507791120, 1507515780, 1507620630, 
    1507515540, 1507356390, 1508857170, 1507790070, 1507361760, 
    1507719270, 1507597980, 1507603260, 1507784520, 1507364670, 
    1507791000, 1507696350, 1507791510, 1507828380, 1507613910, 
    1508085660, 1508085480, 1508899080, 1507607370, 1507828440, 
    1507606050, 1507780860), class = c("POSIXct", "POSIXt"), tzone = "UTC"), 
    sleeptype = c("asleep", "awake", "restless", "rem", "awake", 
    "light", "wake", "wake", "asleep", "asleep", "restless", 
    "rem", "deep", "asleep", "restless", "light", "restless", 
    "restless", "wake", "light", "deep", "asleep", "light", "restless", 
    "deep", "Unknown", "light", "asleep", "wake", "asleep", "rem", 
    "wake", "wake", "restless", "restless", "rem", "restless", 
    "restless", "light", "asleep", "rem", "restless", "light", 
    "light", "asleep", "light", "asleep", "asleep", "rem", "wake", 
    "restless", "deep", "light", "asleep", "restless", "deep", 
    "asleep", "deep", "asleep", "light", "asleep", "asleep", 
    "restless", "deep", "deep", "light", "deep", "light", "light", 
    "restless", "asleep", "light", "light", "rem", "wake", "light", 
    "restless", "awake", "restless", "wake", "restless", "light", 
    "wake", "rem", "wake", "light", "light", "light", "wake", 
    "awake", "wake", "restless", "rem", "asleep", "restless", 
    "restless", "light", "awake", "rem", "light"), Date = structure(c(17445, 
    17448, 17448, 17464, 17445, 17451, 17449, 17450, 17448, 17463, 
    17448, 17451, 17463, 17448, 17448, 17464, 17448, 17448, 17451, 
    17450, 17451, 17445, 17449, 17449, 17449, 17463, 17463, 17450, 
    17463, 17463, 17450, 17464, 17451, 17463, 17451, 17449, 17449, 
    17450, 17464, 17451, 17449, 17448, 17451, 17449, 17463, 17463, 
    17448, 17448, 17451, 17448, 17448, 17451, 17449, 17451, 17448, 
    17464, 17449, 17449, 17448, 17451, 17448, 17449, 17449, 17451, 
    17450, 17464, 17449, 17450, 17463, 17448, 17448, 17448, 17463, 
    17449, 17451, 17451, 17448, 17449, 17448, 17446, 17463, 17451, 
    17446, 17450, 17449, 17449, 17451, 17446, 17451, 17450, 17451, 
    17451, 17449, 17454, 17454, 17464, 17449, 17451, 17449, 17451
    ), class = "Date")), row.names = c(NA, -100L), class = c("tbl_df", 
"tbl", "data.frame"))

Каждый день содержит данные из разных часов дня.Я хотел бы построить время на оси X, тип сна как фактор на оси Y.Вот что у меня есть:

 ggplot() + geom_segment(data = df, aes(x =starttime, y = sleeptype, xend = endtime, 
  yend = sleeptype, col= sleeptype), size = 2) +  
  facet_wrap(~Date, scales = "free_x") +
  scale_x_datetime(breaks = date_breaks("1 hour"), date_labels = "%H")

Мне не хватает двух вещей:

  1. Как соединить сегменты вертикальными (более похожими на диагональные) линиями?Для примера смотрите ссылку.https://www.google.co.il/search?q=sleep+stages&source=lnms&tbm=isch&sa=X&ved=0ahUKEwj5j_LFv-_dAhVCiRoKHaE2AxgQ_AUIDigB&biw=1920&bih=894#imgdii=mPhTg0I0Sw3DQM:&imgrc=-M2t6q6EI9fZdM:

  2. Я бы хотел, чтобы ограничение времени составляло от 00:00 до 23:59 для каждого аспекта.Самый близкий, который я получил, был scales = "free_x", но это сосредотачивается на доступном периоде каждого дня.Я бы хотел, чтобы все дни были одинаковыми.Если я не использую свободные масштабы, ограничение времени для каждого аспекта - это полный период времени всего фрейма данных.

Любая помощь будет принята с благодарностью.Спасибо!

1 Ответ

0 голосов
/ 05 октября 2018

Я думаю, что это можно решить в два этапа:

1) Присвоить номер различным типам сна, которые можно использовать с geom_step.

2) Создать альтернативную метку временикоторый использует произвольный день (Sys.Date будет сегодня, но это может быть любой день, и не имеет значения) в сочетании с временной частью ваших временных меток.

Самый простой способ представить результирующие данные с помощью geom_step, но этот geom работает лучше всего, когда данные непрерывны без каких-либо пробелов, т. е. где каждый starttime соответствует последнему enddtime.Здесь все еще работает прилично, но мы не можем видеть длительность последнего сегмента в каждом скоплении данных.

В качестве альтернативы, чтобы увидеть длину всех сегментов, мы могли бы использовать geom_segment, нотогда мы должны были бы вручную создать вертикальные части и добавить их, как здесь: R - (ggplot) Делать скачки geom_step пунктирными

library(lubridate); library(dplyr)

# convenience function to convert datetime to today
today_time <- function(datetime) {
  ymd_hms(paste(Sys.Date(), hour(datetime), minute(datetime), second(datetime)))
}

df2 <- df %>%
  # These are my guesses, of course code as 
  mutate(sleep_level = case_when(sleeptype == "awake"     ~ 6,
                                 sleeptype == "wake"      ~ 6,
                                 sleeptype == "rem"       ~ 5,
                                 sleeptype == "restless"  ~ 4,
                                 sleeptype == "light"     ~ 3,
                                 sleeptype == "asleep"    ~ 2,
                                 sleeptype == "deep"      ~ 1,
                      # TRUE captures everything else, incl NA
                                 TRUE                     ~ -1),
     start_today = today_time(starttime),
     end_today   = today_time(endtime)              
  )


ggplot(df2) +
  geom_hline(yintercept = 0, color = "gray70") +
  geom_step(aes(x = start_today, y = sleep_level)) +
  # geom_segment(aes(x = start_today, xend = end_today,
  #                  y = sleep_level, yend = sleep_level)) +
  facet_wrap(~Date) +
  scale_x_datetime(date_labels = "%H:%M")

enter image description here

...