У меня будет много Numpy массивов , хранящихся в npz файлах, которые сохраняются с использованием функции savez_compressed .
Я делю информацию на множество массивов, потому что, если нет, то функции, которые я использую, аварийно завершают работу из-за проблем с памятью.Данные не редки.
Мне нужно будет объединить всю эту информацию в одном уникальном массиве (чтобы иметь возможность обрабатывать ее с помощью некоторых подпрограмм) и сохранить ее на диске (чтобы обрабатывать ее много раз с параметрами diffente)).
Массивы не помещаются в ОЗУ + подкачка памяти.
Как объединить их в уникальный массив и сохранить на диск?
Я подозреваю, что мне следует использовать mmap_mode , но я не понимаю, как именно.Кроме того, я думаю, что это может быть связано с некоторыми проблемами с производительностью, если я сначала не зарезервировал непрерывное дисковое пространство.
Я прочитал эту публикацию, но я все еще не могу понять, как это сделать.
РЕДАКТИРОВАТЬ
Пояснение: Я сделал много функций для обработки похожих данных, некоторые из них требуют массив в качестве аргумента.В некоторых случаях я мог передать им только часть этого большого массива, используя нарезку.Но все равно важно иметь всю информацию.в таком массиве.
Это из-за следующего: Массивы содержат информацию (из физических симуляций) упорядоченного времени.Среди аргументов функций пользователь может установить начальный и последний раз для обработки.Кроме того, он / она может установить размер фрагмента обработки (что важно, поскольку это влияет на производительность, но допустимый размер фрагмента зависит от вычислительных ресурсов).Из-за этого я не могу хранить данные как отдельные фрагменты.
Способ построения этого конкретного массива (тот, который я пытаюсь создать) не важен, пока он работает.