Я изменил интеграцию списка в список интеграций, чтобы я мог использовать ParallelTable
:
X1par=ParallelTable[Integrate[i, {x, -1, 1}], {i, Nw.Transpose[Nw]}];
X1par==X1
(* ===> True *)
Y1par = ParallelTable[Integrate[i,{x,-1,1}],{i,D[Nw,{x,2}].Transpose[D[Nw,{x,2}]]}]
Y1 == Y1par
(* ===> True *)
В мои сроки, когда {j, 5, 30, 1}
вместо {j, 5, 200, 1}
использовалось для некоторого ограничения времени, это примерно в 3,4 раза быстрее на моем ядре quod-core. Но это можно сделать еще быстрее с помощью:
X2par = Parallelize[Integrate[#, {x, -1, 1}] & /@ (Nw.Transpose[Nw])]
X2par == X1par == X1
(* ===> True *)
Это примерно в 6,8 раза быстрее, в 2,3 раза из-за Parallelize
.
Timing
и AbsoluteTiming
не очень заслуживают доверия, когда речь идет о параллельном выполнении. Я использовал AbsoluteTime
до и после каждой строки и взял разницу.
EDIT
Мы не должны забывать ParallelMap:
На уровне самого грубого списка (1):
ParallelMap[Integrate[#, {x, -1, 1}] &, Nw.Transpose[Nw], {1}]
На самом глубоком уровне списка (наиболее мелкозернистое распараллеливание):
ParallelMap[Integrate[#, {x, -1, 1}] &, Nw.Transpose[Nw], {2}]