Какой самый быстрый способ собрать сегменты данных из массива NumPy в каждой точке набора данных, нормализовать их на основе знака (+ ve / -ve) в начале сегмента и усреднить все сегменты вместе?
В настоящее время у меня есть:
import numpy as np
x0 = np.random.normal(0,1,5000) # Dataset to be analysed
l0 = 100 # Length of segment to be averaged
def average_seg(x,l):
return np.mean([x[i:i+l]*np.sign(x[i]) for i in range(len(x)-l)],axis=0)
av_seg = average_seg(x0,l0)
Время для этого выглядит следующим образом:
%timeit average_seg(x0,l0)
22.2 ms ± 362 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
Это делает работу, но есть ли более быстрый путь сделать это?
Приведенный выше код страдает, когда длина x0 велика и когда значение l0 велико. Мы смотрим на циклический просмотр этого кода несколько миллионов раз, поэтому даже постепенные улучшения помогут!