У меня есть 3000 двоичных файлов (каждый размером 40 [МБ]) известного формата (5 000 000 «записей» типа «int32, float32» каждый).они были созданы с использованием метода numpy
tofile ().
Метод, который я использую, WhichShouldBeUpdated()
, определяет, какой файл (из 3000) должен быть обновлен, а также, какие записи в этом файле должныбыть изменен.Вывод метода следующий:
(1) path_to_file_name_to_update
(2) массив пустых записей с N
записями (N
- количество записей для обновления),в следующем формате: [(recordID1, newIntValue1, newFloatValue1), (recordID2, newIntValue2, newFloatValue2), .....]
Как видно:
(1) файл для обновления известен только во время выполнения
(2) записи вОбновление также известно только во время выполнения
, что было бы наиболее эффективным способом обновления файла новыми значениями для записей?