Question

У меня есть такой фрейм данных панели

date    firms return
5/1/1988    A   5
6/1/1988    A   6
7/1/1988    A   4
8/1/1988    A   5
9/1/1988    A   6
11/1/1988   A   6
12/1/1988   A   13
13/01/1988  A   3
14/01/1988  A   2
15/01/1988  A   5
16/01/1988  A   2
18/01/1988  A   7
19/01/1988  A   3
20/01/1988  A   5
21/01/1988  A   7
22/01/1988  A   5
23/01/1988  A   9
25/01/1988  A   1
26/01/1988  A   5
27/01/1988  A   2
28/01/1988  A   7
29/01/1988  A   2
5/1/1988    B   5
6/1/1988    B   7
7/1/1988    B   5
8/1/1988    B   9
9/1/1988    B   1
11/1/1988   B   5
12/1/1988   B   2
13/01/1988  B   7
14/01/1988  B   2
15/01/1988  B   5
16/01/1988  B   6
18/01/1988  B   8
19/01/1988  B   5
20/01/1988  B   4
21/01/1988  B   3
22/01/1988  B   18
23/01/1988  B   5
25/01/1988  B   2
26/01/1988  B   7
27/01/1988  B   3
28/01/1988  B   9
29/01/1988  B   2

Теперь из приведенных выше данных панели я хочу найти переменную с именем DMAX.DMAX означает единицу дней как разницу между максимальным днем возврата и последним торговым днем того же месяца.Например, в январе 1988 года максимальная доходность появляется для компании А. 12 января 1988 года. Следовательно, DMAX - это число дней с 12 января 1988 года до конца этого месяца, которое составляет 15 дней.Для фирмы B максимальное значение появляется 22 января 1988 года. Таким образом, оставшееся количество дней в этом месяце составляет 6 дней.Поэтому ожидаемый результат -

date    Firms   DMAX(days)
Jan-88    A      15
Jan-88    B      6

Буду признателен, если вы поможете мне в этом.

Rui Barradas · Answer 1 · 22 декабря 2018

Вот решение tidyverse.

library(tidyverse)
library(zoo)

df1 %>%
  mutate(date = dmy(date),
         month = as.yearmon(date)) %>%
  group_by(firms, month) %>%
  summarise(i = which(return == max(return)),
            DMAX = last(date) - date[last(i)]) %>%
  select(month, firms, DMAX)
## A tibble: 2 x 3
## Groups:   firms [2]
#  month         firms DMAX     
#  <S3: yearmon> <chr> <time>   
#1 Jan 1988      A     17 days  
#2 Jan 1988      B     " 7 days"

G. Grothendieck · Answer 2 · 22 декабря 2018

1) База R Для каждого года / месяца и фирмы агрегируйте разницу между количеством строк и положением строки максимального возврата.Пакеты не используются.

with(transform(DF, date = as.Date(date, "%d/%m/%Y")), 
  aggregate(list(DMAX = return), 
    data.frame(date = format(date, "%Y-%m"), firms),
    function(x) length(x) - which.max(x)))

дает:

     date firms DMAX
1 1988-01     A   15
2 1988-01     B    6

2) зоопарк Читайте DF в объект зоопарка zd с одним столбцом на фирмуа затем объединить это по году / месяцу.Наконец, расплавьте его в длинный фрейм данных, используя fortify.zoo.Строка fortify.zoo может быть опущена, если в результате объект временного ряда зоопарка в порядке.

library(zoo)

zd <- read.zoo(DF, index = "date", format = "%d/%m/%Y", split = "firms")
ag <- aggregate(zd, as.yearmon, function(x) length(na.omit(x)) - which.max(na.omit(x)))
fortify.zoo(ag, melt = TRUE)

, что дает:

     Index Series Value
1 Jan 1988      A    15
2 Jan 1988      B     6

Обратите внимание, что ag - месячный ряд зоопаркаформы:

> ag
          A B
Jan 1988 15 6

3) data.table

library(data.table)

DT <- as.data.table(DF)
DT[, list(DMAX = .N - which.max(return)), 
       by = list(date = format(as.Date(date, "%d/%m/%Y"), "%Y-%m"), firms)]

подача:

      date firms DMAX
1: 1988-01     A   15
2: 1988-01     B    6

Примечание

Lines <- "
date    firms return
5/1/1988    A   5
6/1/1988    A   6
7/1/1988    A   4
8/1/1988    A   5
9/1/1988    A   6
11/1/1988   A   6
12/1/1988   A   13
13/01/1988  A   3
14/01/1988  A   2
15/01/1988  A   5
16/01/1988  A   2
18/01/1988  A   7
19/01/1988  A   3
20/01/1988  A   5
21/01/1988  A   7
22/01/1988  A   5
23/01/1988  A   9
25/01/1988  A   1
26/01/1988  A   5
27/01/1988  A   2
28/01/1988  A   7
29/01/1988  A   2
5/1/1988    B   5
6/1/1988    B   7
7/1/1988    B   5
8/1/1988    B   9
9/1/1988    B   1
11/1/1988   B   5
12/1/1988   B   2
13/01/1988  B   7
14/01/1988  B   2
15/01/1988  B   5
16/01/1988  B   6
18/01/1988  B   8
19/01/1988  B   5
20/01/1988  B   4
21/01/1988  B   3
22/01/1988  B   18
23/01/1988  B   5
25/01/1988  B   2
26/01/1988  B   7
27/01/1988  B   3
28/01/1988  B   9
29/01/1988  B   2
"
DF <- read.table(text = Lines, header = TRUE)

jazzurro · Answer 3 · 22 декабря 2018

Одним из способов использования пакета dplyr было бы следующее.Я назвал ваши данные mydf.Сначала манипулируйте date.Затем сгруппируйте данные по date и firms.Затем вы ищите строку с наибольшим значением в return и обрабатываете вычитание.

mutate(mydf, date = format(as.Date(date, format = "%d/%m/%Y"), "%m-%Y")) %>%
group_by(date, firms) %>%
summarize(DMAX = n() - which.max(return))

# A tibble: 2 x 3
# Groups:   date [?]
#  date    firms  DMAX
#  <chr>   <fct> <int>
#1 01-1988 A        15
#2 01-1988 B         6

DATA

mydf <-structure(list(date = structure(c(18L, 19L, 20L, 21L, 22L, 1L, 
2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 
16L, 17L, 18L, 19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 
8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L), .Label = c("11/1/1988", 
"12/1/1988", "13/01/1988", "14/01/1988", "15/01/1988", "16/01/1988", 
"18/01/1988", "19/01/1988", "20/01/1988", "21/01/1988", "22/01/1988", 
"23/01/1988", "25/01/1988", "26/01/1988", "27/01/1988", "28/01/1988", 
"29/01/1988", "5/1/1988", "6/1/1988", "7/1/1988", "8/1/1988", 
"9/1/1988"), class = "factor"), firms = structure(c(1L, 1L, 1L, 
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("A", "B"), class = "factor"), 
return = c(5L, 6L, 4L, 5L, 6L, 6L, 13L, 3L, 2L, 5L, 2L, 7L, 
3L, 5L, 7L, 5L, 9L, 1L, 5L, 2L, 7L, 2L, 5L, 7L, 5L, 9L, 1L, 
5L, 2L, 7L, 2L, 5L, 6L, 8L, 5L, 4L, 3L, 18L, 5L, 2L, 7L, 
3L, 9L, 2L)), class = "data.frame", row.names = c(NA, -44L
))

Количество оставшихся дней месяца после появления максимального значения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Примечание

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Количество оставшихся дней месяца после появления максимального значения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Примечание

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов