С чего начать распараллеливание кода Python с помощью mpi4py - PullRequest
0 голосов
/ 27 июня 2019

Я пытаюсь оптимизировать код механической пряжки с помощью mpi4py, мне не удалось найти, как я могу распределить вычисления на несколько ядер (точнее, на 4 ядра).Можете ли вы помочь мне с какой функцией mpi4py или как я могу просто оптимизировать эту проблему?Спасибо

Я подумал разделить циклы "for" (особенно первый и последний) на 4 разных чанка или использовать разброс и сбор для распределения вычислений между различными рангами.

param.dat

10000
1000

основной файл


import numpy
import sys
import math
import time

comm = MPI.COMM_WORLD
size = comm.Get_size()
rank = comm.Get_rank()

def secondMembre(N,dt,dx,E, rho, S, I, F, u, SM):
    i=0
    du,d2u,d3u,d4u,NL,lin=0.,0.,0.,0.,0.,0.
    clin, cnl, cm,cmax,maxu=0.,0.,0.,0.,0.

    u[0] = 0.
    u[1] = 0.
    SM[0]= 0.
    SM[1]= 0.

    u[N-2] = 0.
    u[N-1] = 0.
    SM[N-2]= 0.
    SM[N-1]= 0.

    for i in range(2,N-2):

        du = (u[i+1] - u[i-1])/(2.0*dx)

        d2u = (u[i+1] - 2.0*u[i] + u[i-1])/(dx*dx)

        d4u = (u[i+2] - 4.0*u[i+1] + 6.0*u[i] -4.0*u[i-1] + u[i-2])/(dx*dx*dx*dx)

        NL = -(E/rho)*0.5*du*du*d2u

        lin = -(E*I/(rho*S))*d4u + dx*F

        SM[i] = lin +NL

        maxu = numpy.fmax(math.fabs(u[i]),maxu)


    clin = math.sqrt((6.0*E*I)/(rho*S))
    cnl  = math.sqrt(2.0*E/rho)*maxu
    if(maxu<1.0e-14):
        cnl = 0

    cm = numpy.fmax( clin , cnl)
    cmax = numpy.fmax(cm,cmax)
    return cmax

def integre(N,dt,u,v,SM):

    for i in range(0,N):

        v[i] = v[i] + dt*SM[i]
        u[i] = u[i] + dt*v[i]


def writing(file,N,dx,u):
    for i in range(0,N):

        file.write("%.12lf %.12lf\n" %((i+0.5)*dx,u[i]))

fres = open("def.dat","w");
finit = open("def_init.dat","w")
fparam = open("param.dat","r+")

N=int(fparam.readline())
Nt=int(fparam.readline())
print("%d %d\n" %(N,Nt))

u = numpy.zeros(N)
v = numpy.zeros(N)
SM = numpy.zeros(N)
dx = 1.0/N
E = 1.0e9
rho = 1.0e3
b = 0.02
h = 0.02
S = b*h
I = b*h*h*h/12.0
F = -1000.0
dt = 1.0e-10

for i in range(0,N):
    u[i] = 0.
    v[i] = 0.
    SM[i]= 0.
writing(finit,N,dx,u)

Эта следующая часть кода занимает больше всего времени, поэтому я предполагаю, что это будет цикл для разделения на разные куски.

for it in range(0,Nt):
    cm = secondMembre(N,dt,dx,E,rho,S,I,F,u,SM)
    dt = 0.5*dx*dx/cm
    integre(N,dt,u,v,SM)

writing(fres,N,dx,u)
fres.close()
finit.close()
...