Как создать фиктивные записи на основе выборки из фрейма данных? - PullRequest
0 голосов
/ 08 сентября 2018

У меня 40 записей с примерно 100 столбцами.

пример:

DF

id   email       phone    first_name ......
1    a@a.com     123       adam
2    b@b.com     456       bob

Можно ли как-нибудь взять образец каждого столбца и заставить python разрабатывать образцы данных на основе типов данных в столбцах?

Таким образом, код автоматически генерирует фальшивый идентификатор, адрес электронной почты и номера телефонов. в идеале я могу указать количество созданных фальшивых записей, например, необходимо 2 миллиона строк, и я могу добавить слово fake в один из столбцов, например first_name.

новый дф

id   email       phone    first_name ......
1    a@a.com     123       adam
2    b@b.com     456       bob
3    c@c.com     789       fake_carly
4    c@c.com     789       fake_david

1 Ответ

0 голосов
/ 09 сентября 2018

Библиотека Python faker, кажется, хорошо принята для того, что вы делаете.

Более подробную информацию можно найти здесь: github.com / joke2k / Факер

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...