У меня есть набор данных, который имеет следующую форму:
> dput(greece_news_data_combined[27192:27220,])
structure(list(time_and_date_correct = structure(c(1295435821.228,
1295436780, 1295436780, 1295441160, 1295449020, 1295449020, 1295449020,
1295449020, 1295449020, 1295449020, 1295449020, 1295449020, 1295462160,
1295462160, 1295464200, 1295464200, 1295497810.833, 1295498110.378,
1295498410.519, 1295498710.444, 1295499010.456, 1295499310.399,
1295499610.479, 1295499910.325, 1295500210.583, 1295500510.338,
1295500810.38, 1295501110.317, 1295501410.539), class = c("POSIXct",
"POSIXt"), tzone = ""), log_returns = c(0, NA, NA, NA, NA, NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, -0.00601513577729679,
-0.000206914274819529, 2.67010219832664e-05, 0.0024201544576403,
0.0050083466252285, -0.00333167721488612, 0.00130213542003227,
0.00560767076743004, 0.000679785002929741, 0.000336421598800745,
-7.91478416137673e-05, 0.00181223339755887, 0.00268922532925481
), negative_percentage = c(NA, 2.20883534136546, 2.20883534136546,
5.55555555555556, 3.59897172236504, 3.59897172236504, 3.59897172236504,
3.59897172236504, 3.59897172236504, 3.59897172236504, 3.59897172236504,
3.59897172236504, 4.45269016697588, 4.45269016697588, 1.39442231075697,
2.1978021978022, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,
NA, NA), positive_percentage = c(NA, 2.81124497991968, 2.81124497991968,
3.17460317460317, 0.25706940874036, 0.25706940874036, 0.25706940874036,
0.25706940874036, 0.25706940874036, 0.25706940874036, 0.25706940874036,
0.25706940874036, 0.556586270871985, 0.556586270871985, 0.99601593625498,
1.0989010989011, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,
NA, NA), sum_of_negative = c(NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_), number_of_articles = c(NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_,
NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_
)), row.names = 27192:27220, class = "data.frame")
Я хотел бы сохранить суммы строк между NA, а также их количество.Есть несколько частей моего набора данных, которые появляются между NA, я хотел бы как-то свернуть их, а затем иметь суммы и количество строк, чтобы я мог вычислить средние для переменных Var1 и т. Д. Есть идеи, как это сделать?