Question

Я хочу добавить новый столбец во фрейм данных ниже, который рассчитывает максимальную длину сухого заклинания для каждого месяца. Вот как выглядит мой фрейм данных:

   day month year  rr spell spell1
     1     1 1981  0   dry      1
     2     1 1981  0   dry      1
     3     1 1981  0   dry      1
     4     1 1981  1.1 dry      0
     5     1 1981  0   dry      1
     6     1 1981  0   dry      1
     7     1 1981  0   dry      1
     8     1 1981  0   dry      1
     9     1 1981  2.7 dry      0
    10     1 1981  0   dry      1

Это вывод, который мне нужен:

 month year  spell_length
     1 1981      3
     1 1981      4
     1 1981      1

это то, что я сделал до сих пор:

group_by(df, year, month, spell1) %>% 
    summarise(spell2 = sum(spell1, na.rm = TRUE))

и вот результат:

  year month spell1 spell_length
  <int> <int>  <dbl>  <dbl>
1  1981     1      1     31
2  1981     2      0      0
3  1981     2      1     27
4  1981     3      0      0
5  1981     3      1     25
6  1981     4      0      0

Данные

df <- read.table(h= T, text="day month year  rr spell spell1
1     1 1981  0   dry      1
2     1 1981  0   dry      1
3     1 1981  0   dry      1
4     1 1981  1.1 dry      0
5     1 1981  0   dry      1
6     1 1981  0   dry      1
7     1 1981  0   dry      1
8     1 1981  0   dry      1
9     1 1981  2.7 dry      0
10     1 1981  0   dry      1")

Ronak Shah · Answer 1 · 10 мая 2019

Используя dplyr, мы можем создавать группы в каждом случае 0, используя cumsum и суммировать число spells в каждой группе.

library(dplyr)

df %>%
  group_by(month, year, group = cumsum(spell1 == 0)) %>%
  summarise(spell_length = sum(spell1)) %>%
  ungroup() %>%
  select(-group)

#    month  year spell_length
#   <int> <int>        <int>
#1     1  1981            3
#2     1  1981            4
#3     1  1981            1

akrun · Answer 2 · 10 мая 2019

Одним из вариантов будет группирование по 'run-length-id' из 'spell' (rleid из data.table - создает новый идентификатор группировки при изменении значения в этом столбце), filter из строкесли 'spell1' равно 0, получите число строк с n()

library(dplyr)
library(data.table)
df1 %>%
    group_by(year, month, grp = rleid(spell1)) %>%
    filter(spell1 ==1) %>%
    summarise(spell_length = n()) %>%
    ungroup %>%
    select(-grp)
# A tibble: 3 x 3
#   year month spell_length
#  <int> <int>        <int>
#1  1981     1            3
#2  1981     1            4
#3  1981     1            1

или используйте rle из base R

rl1 <- rle(df1$spell1)
rl1$lengths[rl1$values > 0]
#[1] 3 4 1

ПРИМЕЧАНИЕ. Это решениетакже работает, когда значения 'spell1' отличаются

Moody_Mudskipper · Answer 3 · 10 мая 2019

Вот вариант использования dplyr::count:

library(dplyr)
count(df, month, year, grp = cumsum(spell1 == 0), zero = spell1==0) %>%
  filter(!zero) %>%
  select(-zero, - grp)

# # A tibble: 3 x 3
#   month  year     n
#   <int> <int> <int>
# 1     1  1981     3
# 2     1  1981     4
# 3     1  1981     1

Или в базе R:

res <- aggregate(day ~  month + year + cumsum(spell1 == 0) + (spell1==0), df, length)
res[!res[[4]],-(3:4)]
#   month year day
# 1     1 1981   3
# 2     1 1981   4
# 3     1 1981   1

tmfmnk · Answer 4 · 10 мая 2019

Используя основную идею @akrun, но без data.table::rleid():

df %>%
 group_by(year, month, rleid = with(rle(spell1), rep(seq_along(lengths), lengths))) %>%
 filter(spell1 > 0) %>%
 ungroup() %>%
 count(month, year, rleid, name = "spell_length") %>%
 select(-rleid) 

  month  year spell_length
  <int> <int>        <int>
1     1  1981            3
2     1  1981            4
3     1  1981            1

Или:

df %>%
 group_by(year, month, rleid = with(rle(spell1), rep(seq_along(lengths), lengths))) %>%
 filter(spell1 > 0) %>%
 summarise(spell_length = length(rleid)) %>%
 ungroup() %>%
 select(-rleid)

Подведите итог, чтобы вернуть длину по группе

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Подведите итог, чтобы вернуть длину по группе

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов