как уменьшить дисковое пространство, если у нас есть 10000 файлов данных тестового ввода - PullRequest
0 голосов
/ 24 декабря 2018

У нас есть 10000 тестовых наборов, каждый тестовый набор имеет входной файл теста XMLТаким образом, существует 10 000 файлов XML, которые занимают много дискового пространства около 2 ГБ.

мы преобразовали все файлы XML в файлы JSON.которые уменьшают значительный объем пространства.

Мой вопрос?

Есть ли какой-либо инструмент или другой способ уменьшить размер, не влияя на производительность.

1 Ответ

0 голосов
/ 24 декабря 2018

Одним из возможных способов является сжатие и хранение файлов данных на диске по отдельности.Когда нужен файл данных, просто распакуйте его через код и используйте его.

В случае Java вы можете использовать java.util.zip.GZIPOutputStream и java.util.zip.GZIPInputStream для сжатия и распаковки файлов.Расширение файла будет «.gz».

Python также имеет модуль 'gzip' для поддержки сжатия / распаковки файлов .gz.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...