Программа Python была убита после примерно 400-го цикла - PullRequest
2 голосов
/ 09 июля 2019

Моя программа на python была убита после примерно 400 циклов, мой список не закончился. Программа предназначена для регистрации данных об осадках из ESRI ascii и экспорта в виде netCDF.

Моя система - Ubuntu 18.xx, а python - версия 3.7. Первоначально я работал в лаборатории Юпитера, и я подумал, что это может быть ограничением лаборатории Юпитера. Затем я запустил как скрипт, но это то же самое.

# Libraries
import numpy as np
import pandas as pd
import xarray as xr
import xesmf as xe
import os

# Funtion to read ESRI ASCII
def read_grd(filename):
    with open(filename) as infile:
        ncols = int(infile.readline().split()[1])
        nrows = int(infile.readline().split()[1])
        xllcorner = float(infile.readline().split()[1])
        yllcorner = float(infile.readline().split()[1])
        cellsize = float(infile.readline().split()[1])
        nodata_value = int(infile.readline().split()[1])
    lon = xllcorner + cellsize * np.arange(ncols)
    lat = yllcorner + cellsize * np.arange(nrows)
    value = np.loadtxt(filename, skiprows=6)

    return lon, lat, value


### Static data setting ===============================

# Input variables (date)
dir_rainfall = "./HI_1994_1999/"
dir_out = "./HI_1994_1999_regridded/"
arr = sorted(os.listdir(dir_rainfall)) #len(arr) = 50404

# Read the spatial data that we're going to regridde
ds_sm = xr.open_dataset('./Spatial_Metadata.nc',autoclose=True)

ds_out = xr.open_dataset('./regrid_frame.nc')
ds_out.rename({'XLONG_M': 'lon', 'XLAT_M': 'lat'}, inplace=True)
ds_out['lat'] = ds_out['lat'].sel(Time=0, drop=True)
ds_out['lon'] = ds_out['lon'].sel(Time=0, drop=True)

### LOOP ==============================================
i = 1690  # It kept stopped every ~400 iteration, so I added this to restart from the last killed.
arr = arr[i:len(arr)]

for var in arr:

    # get dateTime
    dateTime = var.replace('hawaii_',"")
    dateTime = dateTime.replace("z","")
    print("Regridding now " + str(i) + " : " + dateTime)

    # Read rainfall ASCII and calculate rain rate
    asc = read_grd(dir_rainfall + var)
    precip_rate = np.array(asc[2] / (60.0*60.0))
    precip_rate = precip_rate.astype('float')
    precip_rate[precip_rate == -9999.] = np.nan
    x = np.repeat([asc[0]], 1, axis=0).transpose()
    y = np.repeat([asc[1]], 1, axis=0)

    # Format rain rate to netCDF
    ds = xr.Dataset({'RAINRATE': (['lat', 'lon'],  precip_rate)},
                    coords={'lon': (['lon'], asc[0]),
                            'lat': (['lat'], asc[1])})

    # Regrid
    regridder = xe.Regridder(ds, ds_out, 'bilinear', reuse_weights=True) # create regriding frame

    dr = ds.RAINRATE
    dr_out = regridder(dr)

    # change the name of coordinates for the regridded netCDF
    dr_out.coords['west_east'] = ds_sm.x.values
    dr_out.coords['south_north'] = ds_sm.y.values
    dr_out = dr_out.rename({'west_east': 'x', 'south_north': 'y'})

    # add attributes to the regridded netCDF
    dr_out.attrs['esri_pe_string'] = ds_sm.crs.attrs['esri_pe_string']
    dr_out.attrs['units'] = 'mm/s'


    # Export the YYYYMMDDHHMMPRECIP_FORCING.nc
    dr_out.to_netcdf(dir_out + dateTime + '00.PRECIP_FORCING.nc')

    i = i + 1

Первые ~ 400 ESRI ASCII были успешно преобразованы. Потом он просто застрял, пока я запускал его в лаборатории Юпитера; если я пускаю дождь из сценария python xxx.py, то после ~ 400 пробега он возвращает мне «убито» из моего терминала.

=== [редактировать 7/11/2019] Добавить информацию об использовании памяти ===

По словам @zmike, это может быть проблема с памятью, поэтому я распечатал память, и это проблема с памятью - память продолжала накапливаться.

Я добавил приведенный ниже код к своему коду.

    # Print out total memory
    process = psutil.Process(os.getpid())
    print(process.memory_info().rss)

enter image description here

1 Ответ

0 голосов
/ 12 июля 2019

Я отвечаю на свой вопрос после поиска и тестирования, надеюсь, он поможет людям с такими же вопросами:

Программа python была убита из-за нехватки памяти.Есть несколько способов уменьшить объем памяти, в том числе

Я могу высвободить часть памяти из описанных выше шагов, и она может достигать ~ 500 циклов~ 2000 циклов, когда я работаю на сервере, а не на персональном компьютере). Проблема с памятью все еще существует, но она стала лучше.

...