У меня есть данные о количестве осадков и расходах за два года, собранные на станциях данных Дуранго за 2012-2013 годы.Для этого исследования я анализирую, как каждое событие осадков ежечасно влияет на сток реки.Данные сброса имеют данные каждые 15 минут, каждый час, каждый день независимо от погоды.Данные об осадках имеют только часы для дождливых часов.Вот два графика, которые я сделал из первых нескольких событий осадка, которые у меня есть:
#after loading in my .CSVs 'animas' and 'durango':
disc1 <- animas[c(8700:9000), c(3,5)]
prec1 <- durango[c(3:11),c(6:7)]
ggplot(data = disc1, aes(x=datetime, discharge))+geom_point()+theme(axis.text.x = element_text(angle = 45, hjust = 1))
ggplot(data = prec1, aes(x=DATE, HPCP))+ geom_point()+ theme(axis.text.x = element_text(angle = 45, hjust = 1))
разрядка, все часы отображаются на графике Осадки, пропущенные часы в виде нулей
То, как осадки наносятся с пропущенными часами, неприемлемо для моей цели.Мне нужно как-то сгенерировать эти пропущенные часы и заполнить пустые значения осадков («HPCP») нулями, чтобы я мог построить их на той же шкале времени, что и расход.
Кроме того, есть ли способ отделить этоданные в отдельные события осадков, за исключением событий, которые составляют менее 0,05 дюйма?(В отличие от установки всех временных ограничений для сотен случаев выпадения осадков вручную).Мне нужно сгенерировать наборы часов, в которые произошло событие с осадками, и добавить значения расхода за эти часы.Будем строить графики с течением времени, а также с учетом разницы во времени между пиковыми осадками и пиковыми расходами.Какую структуру данных я должен использовать и как?
Это кажется трудным, потому что нули между часами осадков присутствуют не во всех случаях;например, два дождя с разных дат могут находиться в соседних строках, один за другим.Как я могу отсортировать это быстро?Можно ли добавить хвост, чтобы включить точки за 6 часов до и после времени начала / окончания?
Я перепутал с .csv, чтобы получить две возможные конфигурации даты / времени (HPCP в этом файле просто отсутствует),Что лучше для удобства и построения графиков с ggplots?
Все часы с 0 в HPCP являются часами измерения с флагом «F», что означаетследовое количество осадков было обнаружено.Они слишком незначительны для моего анализа.
Заранее спасибо.