Как я разделить файл json.gz случайно в Python? - PullRequest
0 голосов
/ 26 февраля 2019

У меня большой файл json.gz, он содержит более миллиона отзывов.Мне нужно разлить его по группам, каждая группа представляет собой файл json.gz и должна иметь 200 000 отзывов случайным образом,

как я могу это сделать в python?

1 Ответ

0 голосов
/ 27 февраля 2019

gzip.GzipFile с json.load, затем используйте random.shuffle и некоторую нарезку списка, а затем снова json.dump с GzipFile.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...