Как сгенерировать дубликат индекса на основе дубликатов значений в другом столбце в Pandas - PullRequest
1 голос
/ 10 февраля 2020

начальные данные

Я хочу создать инкрементный индекс, который учитывает дубликаты в столбце ['name'].

name
vendor1
vendor2
vendor2
vendor3
vendor4
vendor4
vendor4
vendor4

желаемый вывод

id    name
1     vendor1
2     vendor2
2     vendor2
3     vendor3
4     vendor4
4     vendor4
4     vendor4
4     vendor4

1 Ответ

0 голосов
/ 10 февраля 2020

Используйте factorize столбца name и присвойте индексу:

df.index = pd.factorize(df['name'])[0] + 1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...