Python - попытка распараллеливания вычислений внутри класса - PullRequest
0 голосов
/ 21 октября 2018

У меня есть следующий рабочий код:

from itertools import product
import time
import numpy as np

class Basis_NonI(object):
    ''' Non Interfering case'''

    def __init__(self, dimension, generation, embed_dimension = None):
        self.dimension = dimension
        self.generation = generation

    def KineticEnergy(self, vec):
        ''' Returns kinetic energy of a basis vector, according to formual 4*|M·b|^2'''
        return 4*np.abs(vec**2)

    def make_basis(self):
        t = time.time()
        x = np.arange(-self.generation, self.generation)  
        array = np.array([np.array(i) for i in product(x, repeat = self.dimension)]) #cube of basis states
        gens = np.abs(array).sum(axis=1)
        mask = np.where(gens<=self.generation)[0] #the product creates all elemnts up to maxg, but also some at higher maxg (maybe it's fine?)
        array = array[mask]
        gens = gens[mask]

        kins = np.array(map(self.KineticEnergy, array))
        uniqueK = np.unique(kins)

        group_gens = []
        kinenergy_gens = []

        for i in np.arange(self.generation):
            pos = np.where(gens==i)[0]
            group_gens.append(map(np.array, array[pos]))
            kinenergy_gens.append(map(np.array, kins[pos]))

        group_kin = []
        generation_kin = []

        for j in uniqueK:
            posK = np.where(kins==j)[0]
            group_kin.append(map(np.array, array[posK]))
            generation_kin.append(gens[posK])

        print('Basis took {} s'.format(time.time()-t))

        return group_gens, kinenergy_gens, group_kin, generation_kin, uniqueK

if __name__ == '__main__':

    b = Basis_NonI(1, 5)
    a = b.make_basis()

, и я пытаюсь распараллелить некоторые вычисления внутри него, чтобы ускорить его (чтобы я мог увеличить размер задействованных векторов).

make_basis имеет два цикла for, которые заполняют два списка.Поэтому моей первой идеей было распараллелить эти два, породив два процесса:

from itertools import product
import time
import numpy as np
from functools import partial
from multiprocessing import Process

class Basis_NonI(object):
''' Non Interfering case'''

def __init__(self, dimension, generation, embed_dimension = None):
    self.dimension = dimension
    self.generation = generation

def KineticEnergy(self, vec):
    return 4*np.abs(vec**2)

def generation_basis(self, group_gens, kinenergy_gens, gens, kins, array):
    for i in np.arange(self.generation):
        pos = np.where(gens==i)[0]
        group_gens.append(map(np.array, array[pos]))
        kinenergy_gens.append(map(np.array, kins[pos]))
    return group_gens, kinenergy_gens

def kinetic_basis(self, uniqueK, kins, group_kin, generation_kin, gens, array):
    for j in uniqueK:
        posK = np.where(kins==j)[0]
        group_kin.append(map(np.array, array[posK]))
        generation_kin.append(gens[posK])
    return group_kin, generation_kin

def run(self):
    t = time.time()
    x = np.arange(-self.generation, self.generation)  
    array = np.array([np.array(i) for i in product(x, repeat = self.dimension)]) #cube of basis states
    gens = np.abs(array).sum(axis=1)
    mask = np.where(gens<=self.generation)[0] 
    array = array[mask]
    gens = gens[mask]
    kins = np.array(map(self.KineticEnergy, array))
    uniqueK = np.unique(kins)

    group_gens = []
    kinenergy_gens = []
    group_kin = []
    generation_kin = []

    func1 = partial(self.generation_basis, group_gens, kinenergy_gens, gens, kins, array)        
    func2 = partial(self.kinetic_basis, uniqueK, kins, group_kin, generation_kin, gens, array)

    p1 = Process(target = func1)
    p2 = Process(target = func2)
    p1.start()
    p2.start()
    p1.join()
    p2.join()

    print('Basis took {} s'.format(time.time()-t))
    return group_gens, kinenergy_gens, group_kin, generation_kin, uniqueK

if __name__ == '__main__':

    b = Basis_NonI(1, 5)
    a = b.run()

Но когда я пытаюсь получить доступ к a, это набор пустых списков, поэтому он фактически не заполняет их.

Что я делаю не так?

1 Ответ

0 голосов
/ 21 октября 2018

Вы должны понимать, что каждый новый процесс получит копию пространства памяти (куча, стек и т. Д.).Сказав это, вам нужно передать результат вычисления с использованием некоторого вида IPC (межпроцессное взаимодействие), например Очередь , Труба или Общая память .

Вы можете облегчить это, используя Пул и , применив или map , которые будут выполнять IPC за вас, как показано в этом примере, взятом из документов:

from multiprocessing import Pool

def f(x):
    return x*x

if __name__ == '__main__':
    with Pool(5) as p:
        print(p.map(f, [1, 2, 3]))
...