Предположим, у меня есть четыре больших файла (слишком больших, чтобы помещать их в память даже по отдельности), в которых есть информация, которую мне нужно обработать. Я намерен создать один объект уровня приложения (запись) из каждой строки в файле # 1. Файлы 2-4 имеют дополнительные фрагменты информации, необходимые для создания этого объекта записи. Например, структура файла может быть следующей:
Файл № 1:
ключ, описание
Файл № 2:
ключ, метаданные, размер
Файл № 3:
Происхождение, скорость, ключ
Файл № 4:
ключ, startDate, endDate
Каждый файл имеет один столбец (известной позиции в строке), представляющий уникальный ключ. Этот ключ является общим для всех файлов, но нет никакой гарантии, что каждый ключ, который существует в каком-либо одном файле, существует в других, то есть мы будем обрабатывать только подмножество ключей, которые существуют во всех. Строки файлов не отсортированы. Можете ли вы разработать алгоритм для создания объектов уровня приложения путем обработки этих файлов?