При этом:
import numpy as np
from numba import jit
@jit
def doit(A, Q, n):
for i in range(len(Q)):
Q[i] = np.sum(A[i:i+n] <= A[i+n])
A = np.random.random(1000*1000)
n = 5000
Q = np.zeros(len(A)-n)
doit(A, Q, n)
время выполнения на моем компьютере составляет ~ 5,4 секунды.
Я пытался использовать функцию распараллеливания numba:
@jit(parallel=True)
def doit(A, Q, n):
for i in range(len(Q)):
Q[i] = np.sum(A[i:i+n] <= A[i+n])
и вместо этого требуется 17 секунд.
Почему Numba parallel=True
делает это вычисление в 3 раза медленнее, чем быстрее?