У меня есть скрипт на python, который загружает модель машинного обучения и классифицирует текстовые файлы. Мой скрипт выглядит примерно так:
import sys
for test_file in sys.argv[1:]:
classify(test_file)
Я запускаю скрипт на 10000 файлов с помощью команды python
python script.py my_dir/*.txt
Где my_dir содержит 10000 текстовых файлов для классификации. Обработка файлов независима, и мне интересно, можно ли распространять этот процесс с помощью потоков. Одним из решений является распределение файлов в отдельных папках и выполнение команд по отдельности, что не кажется лучшим решением.