Эффективное использование памяти в пандах - PullRequest
0 голосов
/ 17 сентября 2018

У меня есть несколько pd.Series, у которых есть datetimeindex (время начала) и значение timedelta (длительность), что эти события происходят. Что-то вроде:

index               | value
1990:01:01 00:00:00 | 1 day 4 hours
1990:01:05 00:00:00 | 0 days 2 hours 3 minutes
...

Я бы хотел иметь возможность взять 2 или более из этих серий и создать новую серию в том же формате, что и побитовые союзы. например если у меня есть две серии, как одна выше, я хотел бы иметь возможность и их создать новую серию, которая будет иметь индексы и длительности для времен, в течение которых события обеих серий были случается.

Способ, которым я сейчас занимаюсь, состоит в том, чтобы расширить серию до логических рядов с одинаковой частотой. Например, приведенный выше пример станет:

index               | value
1990:01:01 00:00:00 | True
1990:01:02 00:00:00 | True
1990:01:03 00:00:00 | False
1990:01:04 00:00:00 | False
1990:01:05 00:00:00 | True
...

Затем я могу выполнить вид операций над множествами, которые я хотел бы создать с перекрывающимися окнами, но он очень требователен к памяти для больших серий и также теряет некоторую точность в зависимости от разрешения новой серии.

Я чувствую, что мог бы быть способ сделать это, который я не смог найти, который был бы намного быстрее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...