Функция R для удаления значений, меньших чем равных нулю, из набора данных - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть однодневный набор данных, который состоит из 1440 показаний / наблюдений с 7 переменными. Я хочу удалить из этого нулевые и отрицательные значения и вычесть среднее из столбцов. Прямо я взял средства colMeans(Dataset), но как удалить строки с отрицательными и нулевыми значениями из набора данных. Также среднее значение должно составлять в общей сложности 1440 наблюдений для каждого столбца. Также среднечасовое аналогичных данных.

Date        Time      BB% BC1 BC2 BC3 BC4 BC5 BC6 BC7
18/06/2019  0:00:00   23  769 642 679 505 514 554 534
18/06/2019  0:01:00   24  770 0   682 643 667 474 509
18/06/2019  0:02:00   22 -732 720 667 725 645 576 468
18/06/2019  0:03:00   19  781 785 673 653 0   656 665
18/06/2019  0:04:00   17  809 748 0   700 677 552 596
18/06/2019  0:05:00   21  726 756 717 579 646 536 613

1 Ответ

0 голосов
/ 17 апреля 2020

Мы можем сначала прочитать данные.

df <- readxl::read_excel('10.10.2019.xls', sheet = '20191010', skip = 4)

, а затем удалите строки, в которых присутствует 0, и рассчитайте mean для выбранных столбцов.

library(dplyr)

df %>% 
  filter_at(vars(AB1:AB7), all_vars(. > 0)) %>%   
  summarise_at(vars(AB1:AB7), mean)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...