Python: анонимизировать данные, используя Faker, слишком долго - PullRequest
0 голосов
/ 28 января 2020

Я недавно начал работать в Python Мне нужно анонимизировать телефонные номера в наборе данных, которые я импортировал. Однако, так как это ключи, мне также необходимо поддерживать уникальность и ссылочную целостность

После долгих поисков в Google я решил go с простым подходом 1) Чтение данных во фрейм данных 2 ) Создание функции с помощью Faker. 3) Засеять фейкер, используя значение ha sh для номера телефона. 4) Используя фейкер, чтобы сгенерировать новое значение для номера телефона. 5) Использование функции apply для запуска всей колонки

. Когда я запускаю этот код, он продолжает работать без вывода / результата / ошибки

Чего мне не хватает?

import pandas as pd

sampledata=pd.read_csv(<filename>,sep='|')
working_data=sampledata[['A_NUM','B_NUM','CALL_DT','CALL_TM','CALL_SEC','CALL_MSEC']]

from faker import Faker
def num_fake(num):
    fake=Faker()
    Faker.seed(hash(num))
    return fake.phone_number()

working_data['AP_NUM'].apply(num_fake)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...