Я масштабирую данные панели в целом или я сначала группирую их? - PullRequest
0 голосов
/ 18 мая 2019

Я управляю панельной регрессией, оценивающей влияние изменения удовлетворенности сотрудников, измеренное на glassdoor.com (рейтинг от 1 до 5) для данной компании на цену акций (скорректировано Fama-French).У меня есть панель с 50 компаниями и 43 кварталами, так как меня интересуют изменения, оба временных ряда сначала различаются (т. Е. X = (рейтинг в Q2 - рейтинг в Q1) и y = (альфа в Q2 - альфа в Q1)).Теперь я хочу стандартизировать свои данные.У меня вопрос: нужно ли стандартизировать весь набор данных или я должен сгруппировать его сначала по кварталу, а затем стандартизировать?

general_reviews <- read.csv("reviews_ general.csv")
#Importing the data
general_data <- pdata.frame(general_reviews, index = c("company","Year_Quarter", "Type"))
#Data is a panel with company as the entity and Year_Quarter the time
general_data <- general_data %>% mutate(alpha = as.numeric(as.character(alpha))) %>% group_by(company) %>% mutate(A1d = dplyr::lead(alpha, 1) - alpha)
#Building the first difference as I am interested in the change.

#Do I use:
general_data <- general_data %>% mutate(A1s = scale(alpha))
#or:
general_data <- general_data %>% group_by(Year_Quarter) %>% mutate(A1s = scale(alpha))
...