Question

Я новичок в Python. У меня 2000 файлов каждый около 100 МБ. Я должен прочитать каждый из них и объединить их в большую матрицу (или таблицу). Могу ли я использовать параллельную обработку для этого, чтобы сэкономить время? Если да, то как? Я пытался искать, и все кажется очень сложным. В настоящее время требуется около 8 часов, чтобы сделать это поочередно. У нас действительно большой сервер с одной оперативной памятью Tera и несколькими сотнями процессоров. Как я могу эффективно использовать это?

Спасибо за вашу помощь.

Raymond Hettinger · Answer 1 · 16 ноября 2011

Вы можете предварительно обработать файлы в отдельных процессах, используя модуль подпроцесс ;однако, если финальная таблица будет храниться в памяти, то этот процесс в конечном итоге станет для вас узким местом.

Существует еще один возможный подход с использованием общей памяти с mmap объектами.,Каждый подпроцесс может быть ответственным за загрузку файлов в подраздел отображенной памяти.

параллельная обработка Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

параллельная обработка Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов