Pybind11: проблема преобразования массива numpy в C ++ с использованием Pybind11 - PullRequest
0 голосов
/ 03 ноября 2019

Я пытаюсь получить массив Python из C ++ и вернуть его обратно в функцию Python, используя также C ++ с Pybind11. Сначала я обращаюсь к словарю numpy массивов, а затем помещаю каждый из этих numpy массивов в функцию Python, которая просто вычисляет сумму элементов в массиве. Основная часть моего кода, которая вызывает у меня проблемы:

        py::array item = list_items.attr("__getitem__")(i); 
    //equivalent to dict.__getitem__[i]

    //code runs if removing the following line
        boost_mod.attr("sum_of_dict")(item).cast<int>(); 
    //calls the function sum_of_dict in the module boost_mod having as argument a 1D numpy array
    //this function computes the sum of the elements in the numpy array, which are all integers 

Я думаю, что у меня проблема с конвертацией, и я не понимаю, как ее преодолеть. Я посмотрел на эту ссылку на документацию , но это не помогло. Я также рассмотрел различные cast возможности и другие сообщения, такие как этот или этот другой , но они не относятся к моей проблеме, поскольку они не используют pybind. Любая помощь или любой намек на преобразование и использование моего объекта массива будет высоко ценится. Большое спасибо


Полный код следующий:

C ++ код

#include <pybind11/pybind11.h>
#include <pybind11/numpy.h>
#include <chrono>
#include <thread>
#include <Python.h>
namespace py = pybind11;
py::module boost_mod = py::module::import("boost_mod");

int parallelize(py::dict list_items, py::object q_in, py::object q_out){

    unsigned int sum = 0;
    unsigned int len = list_items.attr("__len__")().cast<int>();
    for( unsigned int i = 0; i < len ; i++){

        //PROBLEM IS HERE//
        py::array item = list_items.attr("__getitem__")(i);
        sum+= boost_mod.attr("sum_of_dict")(item).cast<int>();
        std::this_thread::sleep_for(std::chrono::milliseconds(5));

    }
    return sum;
}

PYBIND11_MODULE(cpp_parallel, m) {

    m.doc() = "pybind11 plugin";
    m.def("parallelize", &parallelize,
      "a function");
}

Модуль Python, который содержитфункция

import numpy as np
import cpp_parallel as cpp

class child(object):
    def __init__(self, index):
        self.nb = index
        self.total = None

    def sum(self, i, j):
        return self.nb + self.nb

    def create_dict(self):
        self.list_items = {}
        for i in range(self.nb):
            lth = np.random.randint(1,10)
            a = np.random.binomial(size=lth, n=1, p =0.6)
            self.list_items[i] = a
        return self.list_items

    def sum_of_dict(self, element):  # fonction comme eval function
        a = np.sum(element)
        return a

    def sub(self, q_in, q_out):
        //FUNCTION CALLED FROM C++//
        return cpp.parallelize(self.list_items, q_in, q_out)

код Python

from multiprocessing import Process, Queue
import time
import boost_mod as test
import cpp_parallel as cpp

q_in = Queue()
q_out = Queue()

q_in.put(True)

dict_evaluated = test.child(1000)
dict_evaluated.create_dict()
dict_evaluated.sub(q_in, q_out)

1 Ответ

0 голосов
/ 03 ноября 2019

На самом деле я неправильно создал экземпляр модуля, из которого я вызываю функцию. Кредиты идут на Вим Лаврийсен. Ответ следующий:

#include <pybind11/pybind11.h>
#include <pybind11/numpy.h>
#include <omp.h>
#include <chrono>
#include <thread>
#include <Python.h>
namespace py = pybind11;
py::module boost_mod = py::module::import("boost_mod");


int parallelize(py::object child, py::object q_in, py::object q_out){

    unsigned int sum = 0;
    py::object items = child.attr("list_items");
    unsigned int len = items.attr("__len__")().cast<int>();
    #pragma omp simd reduction (+:sum)
    for( unsigned int i = 0; i < len ; i++){

        py::array item = items.attr("__getitem__")(i);
        sum += child.attr("sum_of_dict")(item).cast<int>();
        bool accord = q_in.attr("get")().cast<bool>();
        if (accord == true){
          q_out.attr("put")(sum);
        }
        accord = false;
        std::this_thread::sleep_for(std::chrono::milliseconds(5));
    }
    return sum;
}

PYBIND11_MODULE(cpp_parallel, m) {

    m.doc() = "pybind11 example plugin";

    m.def("parallelize", &parallelize,
      "the function which parallelizes the evaluation");
}

И дочерний класс:

from multiprocessing import Process, Event, Lock, Queue, Pipe
import time
import numpy as np
import cpp_parallel as cpp

class child(object):
    def __init__(self, index):
        self.nb = index
        self.total = None

    def sum(self, i, j):
        return self.nb + self.nb

    def create_dict(self):
        self.list_items = {}
        for i in range(self.nb):
            lth = np.random.randint(1,10)
            a = np.random.binomial(size=lth, n=1, p =0.6)
            self.list_items[i] = a

    def sum_of_dict(self, element):  # fonction comme eval function
        a = np.sum(element)
        return a

    def sub(self, q_in, q_out):
        return cpp.parallelize(self, q_in, q_out)
...