Я пытаюсь запустить функцию func
, которая принимает список индексов в качестве аргумента и обрабатывает данные.
def func(rng):
**some processing**
write_csv_to_disk(processed_data[rng],mode="a")
import multiprocessing
pool = multiprocessing.Pool(4)
pool.map(func,list_of_lists_of_indices)
pool.close()
Функция сохраняет частичную DataFrame[indices]
, обработанную параллельно, в файл в режиме append
. Код работает хорошо для всех подсписков list_of_lists_of_indices
, кроме последнего списка. Данные по индексам в последнем списке не сохраняются в моем файле, и пул закрыт.
list_of_lists_of_indices = [[0,1,2,3,4,.....,99999],[100000,100001,100002,100003,100004,......,199999],.....,[10000000,10000001,...,100000895]]
import multiprocessing
pool = multiprocessing.Pool(4)
pool.map(func,iterable = list_of_lists_of_indices)
pool.close()