Python - назначить уникальный идентификатор каждому уникальному значению в группе на основе значения метки времени - PullRequest
0 голосов
/ 08 ноября 2018

У меня есть проблема, которая похожа на эту запись https://stackoverflow.com/questions/45086369/assign-unique-id-to-each-unique-value-in-group-after-pandas-groupby Однако, один из столбцов для groupby - это Timestamp, и он выдает мне странный вывод следующим образом:

from pandas import Timestamp
df=pd.DataFrame({'day': [Timestamp('2017-03-27'),
                         Timestamp('2017-03-27'),Timestamp('2017-04-01'),
                         Timestamp('2017-04-03'),Timestamp('2017-04-06'),
                         Timestamp('2017-04-07'),Timestamp('2017-04-11'),
                         Timestamp('2017-05-01'),Timestamp('2017-05-01')],
'act_id': ['916298883','916298883','916298883','926539428','930641527',
           '930641527','930641527','966163233','966163233']})

Я сделал это:

df['no_adm'] = df.groupby('act_id')['day'].transform(lambda x: pd.factorize(x)[0]+1)

и это дало мне:

enter image description here

Понятия не имею, как появился 1970-01-01 00: 00: 00.0000000000 и как его удалить. Я просто хочу, чтобы мой фрейм данных был без элемента timestamp в столбце no_adm.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...