Я использую коллекцию пакетов Python, установленных в Docker-контейнере;OSMnx для загрузки данных OSM, а затем networkx для выполнения анализа - я доказал свой код на небольшом подмножестве данных и теперь хочу перейти к масштабу.
Я пытаюсь провести некоторый анализ пригородных поездов в округе Лос-Анджелеса - чтобы сделать это, мне нужно захватить улицы, простирающиеся несколько дальше границы округа, потому что мы позволяем людям ездить из Лос-Анджелеса в другие округа.Первым делом я хотел захватить Калифорнию, а затем обрезать ее через многоугольник с буферизацией в округе - после нескольких часов работы мой контейнер уничтожил процесс Python.Итак, я подумал, что я бы сократил загрузку до всего лишь коробки, используя этот код - даже это не удается в методе graph_from_bbox.Я подготовил свой док-контейнер с 8 ГБ памяти.
greater_la_streets_box = ox.graph_from_bbox(35.114, 33.514, -117.439, -119.316,
network_type='drive', simplify=False,
timeout=3600)
G_projected = ox.project_graph(greater_la_streets_box)
ox.save_graph_shapefile(G_projected, filename='greater_la_streets',
folder='/ds/data/spatial/network/streets/CA/')
Разумно ли, что для обработки потребуется 8 ГБ памяти?Если я правильно прочитал мою статистику док-станции, сетевой ввод-вывод загружается всего ~ 36 МБ, а использование памяти быстро достигает 8 ГБ и в конечном итоге приводит к сбою процесса Python.Существуют способы обойти сбой процесса - меня интересует производительность и существуют ли более эффективные способы использования OSMnx для загрузки данных OSM?