Предполагая, что, как вы говорите, вы сами определите линейную регрессию, вот ответ на вопрос № 1:
Чтобы рассчитать среднее (арифметическое c) значение Return
на Date
используйте, например, tapply
:
tapply(df$Return, df$Date, mean)
19970630 19970731 19970829 19970930
-1.4805676 -0.2102363 -0.6145203 -0.9200052
Данные:
set.seed(12)
df <- data.frame(
Date = c(19970630,19970731,19970829,19970930,19970731,19970829),
Ticker = c(rep("A", 4), rep("B", 2)),
Return = rnorm(6)
)