Подмножество кадра данных, удаляя записи только с одной строкой в ​​час - PullRequest
0 голосов
/ 23 мая 2018

У меня есть набор данных местоположений GPS для проекта исследования дикой природы.GPS-местоположения собирались 2 раза в час (каждые 30 минут).Однако, ошейники GPS иногда пропускают местоположение, приводящее к 1 местоположению / час.Мне нужно настроить текущий фрейм данных так, чтобы он включал в себя только те места, где у меня есть 2 местоположения GPS в час (то есть удаляются строки только с одним местоположением в час).Моя проблема в том, что из-за иерархической структуры данных (местоположения GPS вложены в отдельный идентификатор животного, месяц, день, год и час), я не могу найти простое решение для удаления строк только с 1 местоположением / час.

Data Frame Structure--rows in yellow need to be censored (only 1 location/hour)

Я попробовал обходной путь, используя следующий код для расстояния перемещения (суммируя общее расстояние / 30-минутное местоположение), и он работал отлично, потому что яможет отфильтровать строки по столбцу «Всего».

net_move<-master_deer%>% group_by(COLLAR_ID,Year,WEEK,Month,Day,Hour) %>% summarise(TOTAL_STEPLENGTH = sum(MOVEMENT_DISTANCE), Total = n())

Однако мне нужно использовать аналогичный подход для "Net_Displacement", но я не могу просто добавить эти числа.В идеале, если бы был способ просто подвергать цензуре эти строки с использованием только 1 местоположения в час и сохранять их в качестве мастер-файла, это было бы идеально.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...