У меня есть проект, в котором я должен регулярно использовать сценарий оболочки, который выполняет некоторую предварительную обработку файлов. Это должно быть сделано в соответствии с требованиями проекта и унаследованными причинами - я унаследовал большую часть этого кода.
После обработки этих файлов выходные файлы ДАЛЕЕ обрабатываются сценарием Python.
Есть ли хороший способ запустить это параллельно? Прямо сейчас, вот так выглядит мой рабочий процесс.
Call shell script, processing thousands of files.
Once finished, call Python script, processing even more files.
Once finished, call SQL script to insert all of these files into a database.
Если возможно распараллелить или как группу (одна файловая оболочка -> Python -> SQL) или распараллелить каждую задачу (Параллельная оболочка, Параллель Python, Параллель SQL), это было бы здорово. Хотя все, что я прочитал, похоже, подразумевает, что это логистический кошмар из-за проблем с R / W. Это правда, и если нет каких-либо точек в правильном направлении?