R: точки данных каждые 5 минут в течение нескольких лет -> сводка по времени суток - PullRequest
0 голосов
/ 06 апреля 2019

У меня есть data.frames в R, содержащие значения, измеренные с интервалом в 5 минут. Это огромный объем данных (~ 2 миллиона).

 date                    close     day
73 2015-01-02 00:05:00 0.00861385   0
74 2015-01-02 00:10:00 0.00861385   0
75 2015-01-02 00:15:00 0.00861385   0

Я хочу сгруппировать данные по дневному времени. Например, добавление значения «close» от 2015-01-02 00:05:00 к значению «close» от 2015-02-02 00:05:00 и т. Д. *

Я почти уверен, что им легко управлять, но я не знаю, какие условия поиска мне нужны в Google. Любые крошки будут высоко оценены.

PS: Было бы здорово, если бы были какие-либо решения, избегающие петель, потому что они очень медленные в R

1 Ответ

0 голосов
/ 06 апреля 2019

Вы можете сделать это с библиотекой (data.table).

с вашим набором данных как df:

library(data.table)
setDT(df)                             # set your data.frame to data.table
df[, mins := .GRP, minute(date)]      # group by minutes of your 'date' field
df[, .(sums = sum(close)), by=mins]   # sum by group
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...