У меня есть проект в Python, который требует регрессии многих переменных против многих других. Я использую блокнот Jupyter для ясности, но также хочу использовать другую IDE, если это проще. Мой код выглядит примерно так:
for a in dependent_variables:
for b in independent_variables:
regress a on b
Мой текущий набор данных не очень большой, поэтому все это занимает, может быть, 30 секунд, но скоро у меня будет гораздо больший набор данных, который значительно увеличит требуемое время. Мне любопытно, подходит ли эта ситуация для распараллеливания. В частности, если у меня есть двухпоточный восьмиъядерный процессор (то есть всего 16 процессоров), можно ли запускать одновременные процессы, где каждый процесс сравнивает одну из первых переменных с одной из вторых переменных, что позволяет мне завершить, скажем, восемь из этих регрессий одновременно (если я выделю половину процессоров для этого процесса)? Я не очень знаком с распараллеливанием, и большинство других ответов, которые я нашел, обсуждали распараллеливание одного вызова функции, а не одновременное выполнение нескольких похожих функций. Я ценю помощь!