Фильтр Pandas Dataframe с указанием времени суток или часа - PullRequest
1 голос
/ 18 марта 2019

У меня очень большой набор данных: https://archive.ics.uci.edu/ml/datasets/individual+household+electric+power+consumption

Он содержит около 2,5 млн строк.Индекс фрейма данных Pandas представляет собой временную метку, а затем он содержит несколько столбцов.

Я хочу отфильтровать набор данных, чтобы я видел, например, только строки 9 утра (09:00:00) только за все годы (около 1400)строки aprox -> 365 * 4)

Рамка данных Pandas выглядит следующим образом

Я пробовал это:

dataset.groupby(dataset.index.hour == '09:00:00')

Но это не работает.Я также попытался без успеха это:

dataset['09:00:00']

Спасибо

1 Ответ

1 голос
/ 18 марта 2019

Ваши две попытки близки!Должна быть предусмотрена возможность выбора нужных строк с использованием логической маски следующим образом:

dataset[dataset.index.hour == 9]
...