:)
Я работаю над огромным набором данных (dataframe), который я хочу показать публично, для которого я хочу анонимизировать данные , поэтому вместо пользователей'UUID
, я хочу использовать как новый столбец со строкой, такой как:
user1, user2, user3,
, очевидно, соответствующий ID
вдругой столбец.
Я не могу использовать их, когда / иначе, так как у меня есть более тысячи различных uuids
в df
.
Таким образом, конечный результат должен выглядеть примерно так:
| UUID | User |
|uuid1 |user1 |
|uuid1 |user1 |
|uuid2 |user2 |
|uuid3 |user3 |
Я пытаюсь написать функцию, которая увеличивает число в имени пользователя каждый раз, когда изменяется uuid
, но если у вас есть другие простые идеи, пожалуйста,дай мне знать!:)