Как построить несколько потоков данных, относящихся к одному и тому же диапазону времени - PullRequest
0 голосов
/ 25 января 2019

У меня есть несколько df, которые выглядят так: df

               id          created_at

0 1086341956479959040 2019-01-18 19: 18: 00

1 1086342030027091969 2019-01-18 19: 18: 17

2 1086342031067234304 2019-01-18 19: 18: 18

3 1086342040374439937 2019-01-18 19: 18: 20

4 1086342050168086531 2019-01-18 19: 18: 22 * ​​1012 *

5 1086342075560456192 2019-01-18 19: 18: 28

6 1086342090320154625 2019-01-18 19: 18: 32

7 1086342101254721536 2019-01-18 19: 18: 34

для построения графика я делаю группировку:

df_all.groupby (pd.Grouper (freq = '1Min'))). Count () .plot ()

, которая дает мне то, что я хочу, счетчик id в минуту с течением времени.

Теперь у меня есть другие df, которые имеют ту же структуру, что и выше, сразные идентификаторы и другое распределение во времени, но в том же временном диапазоне.Я не знаю, как я могу отобразить все эти данные в одном графике, я пытался с pd.concat, но у меня есть несколько столбцов идентификатора (это хорошо), но также create_at (это не хорошо)

Как я могу объединить данные осмысленным способом?

Я попытался сделать маскировку, выбрав диапазон дат:

mask = (df_all ['made_at']> '2019-01-01 ') & (df_all [' made_at '] <=' 2019-01-30 ') </p>

, но это не влияет на объединение

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...