Было бы целесообразно загрузить это в базу данных перед выполнением моего анализа?
да
Я планирую провести анализ на разных компьютерах, поэтому будет проще выполнить его через базу данных, но если я увеличу количество компьютеров, чтобы выполнить анализ в базе данных, это может стать слишком медленным.
не беспокойся об этом, все будет хорошо. Просто введите маркер, чтобы идентифицировать строки, обрабатываемые каждым компьютером.
Я не уверен, что полностью понимаю все ваши требования, но если вам нужно сохранить данные (обратитесь к ним более одного раза), тогда вам стоит использовать БД. Если вам просто нужно обработать части этих выходных файлов и доверять результатам, вы можете сделать это на лету, не сохраняя никакого содержимого.
Храните только те данные, которые вам нужны, а не все в файлах.