подсчет строк с использованием pandas dataframe - PullRequest
0 голосов
/ 26 апреля 2018

У меня есть пандас с данными меток времени.Я хочу посчитать, сколько строк у меня в минуту, например, учитывая эту таблицу:

00: 00: 01 data1

00: 00: 21 data2

00: 02: 02 data3

00: 02: 10 data4

00: 02: 31 data5

результат должен быть [2,0, 3].Как я могу это сделать?

1 Ответ

0 голосов
/ 26 апреля 2018

Вы можете сначала преобразовать свой первый столбец в dd типа pd.Timedelta, затем установить его в индекс и использовать повторную выборку со счетом:

from io import StringIO
txt = StringIO("""00:00:01 data1

00:00:21 data2

00:02:02 data3

00:02:10 data4

00:02:31 data5""")

df = pd.read_csv(txt, names=['Time','Value'], sep='\s+')


df['Time'] = pd.to_timedelta(df['Time'])

df = df.set_index('Time')

df_out = df.resample('T').count()

df_out 

Вывод:

          Value
Time           
00:00:01      2
00:01:01      0
00:02:01      3

Всписок:

df_out['Value'].tolist()

Вывод:

[2, 0, 3]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...