У меня есть большой файл tar.gz, который содержит миллионы XML-файлов.
Команда
split
в linux может делиться на количество кусков / строк, но не может делиться на количество файлов . Я хотел бы, например, разделить файл gzip, скажем, по 300 тыс. Файлов в каждом выходном суб-gzip. Есть ли утилита для этого?
Моя конечная цель - обработать tar.gz в Python, и мне нужно разбить файл на более мелкие куски, сохранив файлы. Расщепление позволит обрабатывать их параллельно.