Ускорение кода: определение количества точек в пределах определенного радиуса - PullRequest
0 голосов
/ 15 мая 2018

Я должен найти количество медуз, которые оказались в пределах определенного радиуса пляжа. Я замаскировал массивы широты и долготы. Мои массивы выглядят так (Xpos1 и Ypos1 похожи):

Xpos1
masked_array(
data=[[50.04410171508789, 50.06398010253906, 50.08057403564453, ...,
     --, --, --],
    [49.99235534667969, 50.02357482910156, 50.0404052734375, ..., --,
     --, --],
    [50.04730987548828, 50.074710845947266, 50.092201232910156, ...,
     --, --, --],
    ...,
    [49.98905944824219, 50.507293701171875, 50.48957061767578, ...,
     51.069766998291016, 50.74513626098633, 51.06978988647461],
    [49.91417694091797, 50.510562896728516, 50.48354721069336, ...,
     51.069766998291016, 50.95227813720703, 51.06978988647461],
    [49.976619720458984, 50.504817962646484, 50.487918853759766, ...,
     51.069766998291016, 50.75497817993164, 51.06978988647461]],
mask=[[False, False, False, ...,  True,  True,  True],
    [False, False, False, ...,  True,  True,  True],
    [False, False, False, ...,  True,  True,  True],
    ...,
    [False, False, False, ..., False, False, False],
    [False, False, False, ..., False, False, False],
    [False, False, False, ..., False, False, False]],
 fill_value=9.96921e+36,
 dtype=float32)

 len(Xpos1[0])= 800 000 #Particle
 len(Xpos1)=124 # Timesteps. Xpos1[0] is day 1 hour 1, Xpos1[1] is day 1 hour 2 and so on. 

И теперь я должен выяснить, какие из этих точек находятся рядом с определенным пляжем. Проблема с моим текущим кодом, у меня уходит 5 минут на его вычисление, если я возьму только Xpos [0: 3], потому что массивы такие большие. Учитывая, что мне нужно проверить это для нескольких областей, мой текущий код займет у меня всю жизнь, чтобы закончить работу.

Как ускорить этот код? Требуемый вывод - это массив (Blen), который для каждого временного шага дает мне количество желе в радиусе.

Blen=[124,253,100,...] 
len(Blen)=124

Мой код:

#Location of the beach I need to check
lonAa=2.631547
latAa=51.120983
#Frame
#1 degree longitude ||
LongDegree=2*pi*r*(np.cos(math.radians(LatM)))/360
#1 degree latitude =
LatDegree=2*pi*r/360

FrameRadius=10#km

Timestep=3 #Number of timesteps you want to check, for now only 3 and it already takes some time
#Make the frame within which the jellys have to be counted

FrameLeft=lonAAa-(FrameRadius/LongDegree)
FrameRight=lonAAa+(FrameRadius/LongDegree)
FrameUp=latAAa+(FrameRadius/LatDegree)
FrameDown=latAAa-(FrameRadius/LatDegree)

BFrame=np.zeros((Timestep,len(Xpos1[0])))   
#And now the slow part
Blen=[]
for i in range (0,Timestep):
    for j in range (0,len(Xpos1[0])):
            if FrameDown<=Ypos1[i][j]<=FrameUp and FrameLeft<=Xpos1[i][j]<=FrameRight:
                BFrame[i][j]=Ypos1[i][j]                                                                           

Blen=np.count_nonzero(BFrame,axis=1)

1 Ответ

0 голосов
/ 15 мая 2018

То, что вы хотите сделать, это так называемое «профилирование» сценария. В Python уже есть хороший инструмент для профилирования cprofile:

https://docs.python.org/2/library/profile.html

Вы даже можете вызвать cprofile из командной строки с помощью:

python -m cprofile -o output_file python_script.py

Отсюда вы сможете определить узкие места в вашем коде.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...