Как я могу добавить новый идентификатор в DataFrame панд после каждых 5 строк, - PullRequest
0 голосов
/ 03 ноября 2018

Как я могу добавить новый идентификатор в DataFrame панд после каждых 5 строк,

поэтому мои данные:

index            DateTime       A1   A2   A4        AMS  baseD       
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   
16610747    2011-01-03T13:15:59 112 103 368010037   128 003669730   
16610749    2011-01-03T13:17:00 95  90  368010037   128 003669730   
16610751    2011-01-03T13:18:00 75  67  368010037   128 003669730   
16610753    2011-01-03T13:18:59 42  33  368010037   128 003669730   
16610755    2011-01-03T13:20:00 14  7   368010037   128 003669794   
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   
16610747    2011-01-03T13:15:59 112 103 368010037   128 003669730   
16610749    2011-01-03T13:17:00 95  90  368010037   128 003669730   
16610751    2011-01-03T13:18:00 75  67  368010037   128 003669730   
16610753    2011-01-03T13:18:59 42  33  368010037   128 003669730   
16610755    2011-01-03T13:20:00 14  7   368010037   128 003669794   

и мне нужен столбец идентификаторов, который будет увеличиваться после каждых 5 строк

index            DateTime       A1   A2   A4        AMS  baseD      ID 
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   1
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   1
16610747    2011-01-03T13:15:59 112 103 368010037   128 003669730   1
16610749    2011-01-03T13:17:00 95  90  368010037   128 003669730   1
16610751    2011-01-03T13:18:00 75  67  368010037   128 003669730   1
16610753    2011-01-03T13:18:59 42  33  368010037   128 003669730   2
16610755    2011-01-03T13:20:00 14  7   368010037   128 003669794   2
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   2
16610745    2011-01-03T13:15:00 130 122 368010037   128 003669730   2
16610747    2011-01-03T13:15:59 112 103 368010037   128 003669730   2
16610749    2011-01-03T13:17:00 95  90  368010037   128 003669730   3
16610751    2011-01-03T13:18:00 75  67  368010037   128 003669730   3
16610753    2011-01-03T13:18:59 42  33  368010037   128 003669730   3
16610755    2011-01-03T13:20:00 14  7   368010037   128 003669794   3
16610755    2011-01-03T13:20:00 14  7   368010037   128 003669794   3

1 Ответ

0 голосов
/ 03 ноября 2018

Вы можете сгенерировать последовательность из 1,2,3, .... для 5-го процента строк информационного кадра и повторить (np.repeat) каждое значение 5 раз и назначить ID: -)

df['id'] = np.repeat(np.arange(np.ceil(len(df)/5),5)[:len(df)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...