Привет. Я пытаюсь провести некоторый анализ данных о ценах на жилье на продолжительности трех этапов жилищного цикла: бума, спада и обычного времени. Я думаю об определении 3-х этапов по скорости изменения цен. Бум будет иметь положительную скорость изменений в течение некоторых периодов, перебор с отрицательными показателями в течение некоторого времени, нормальное время с показателями около 0.
Мои данные состоят из 347 наблюдений за 4 переменными. "saledate" "MA" "тип" "спальни"
MA относится к скользящим средним ценам на жилье; тип дома или единицы. Прежде всего, мне нужна помощь в вычислении скоростей изменений для каждого наблюдения.
Я сделал это, чтобы разделить данные на дома и единицы (я думаю, что они имеют разные закономерности). И, конечно, порядок по датам.
split(house_price,type)
out1<- data.frame(house_price[1:200,])
data_h <- out1[order(as.Date(out1$saledate,format="%d/%m/%Y")),]
out2<-data.frame(house_price[201:347,])
data_u<- out2[order(as.Date(out2$saledate,format="%d/%m/%Y")),]
> head(data_h,10)
saledate MA type bedrooms
50 31/03/2007 421291 house 3
101 31/03/2007 548969 house 4
51 30/06/2007 421291 house 3
102 30/06/2007 548969 house 4
1 30/09/2007 441854 house 2
52 30/09/2007 421291 house 3
103 30/09/2007 548969 house 4
152 30/09/2007 735904 house 5
2 31/12/2007 441854 house 2
53 31/12/2007 421291 house 3
Как вы видите, есть наблюдения в те же даты. Учитывая это, как я могу рассчитать темпы изменения цен? Я знаю mutate (), но наблюдения в те же даты, кажется, проблема. Любая помощь приветствуется!
Набор данных находится здесь: https://www.kaggle.com/htagholdings/property-sales