Низкая производительность в PostGIS Spatial Query - PullRequest
0 голосов
/ 11 июня 2018

У меня есть пространственный запрос, который находит все точки внутри многоугольника следующим образом:

startpolygon = time.time()
pointInpolygonV2 = """SELECT col.vessel_hash,ST_X(col.the_geom) AS long, ST_Y(col.the_geom) AS lat, ST_Contains(ST_GeomFromEWKT('SRID=4326; POLYGON((-28.828125 65.0721301,-28.125 64.7741253,-139.5703125 -47.0401821, 127.265625 -44.5904672,90 71.1877539,-28.828125 65.0721301))'),ST_GeomFromEWKT(col.the_geom))  FROM samplecol As col;"""
cursor.execute(pointInpolygonV2)
pointsINpol = cursor.fetchall()
endpolygon = time.time()
print (CGREYTIME+ "Time to fetch all points inside a polygon: "+CENDTIME), endpolygon - startpolygon

Таблица имеет вид:

vessel_hash  | status | station | speed |  latitude   |  longitude  | course | heading |        timestamp         |                      the_geom                      
--------------+--------+---------+-------+-------------+-------------+--------+---------+--------------------------+----------------------------------------------------
‎103079215239 | 99     | 841     | 55    | 36.‎14622100 | -5.‎44244810 | 6      | 511     | 2016-07-28T05:55:31.000Z | 0101000020E610000098B55E1D11C515C0847EA65EB7124240

‎103079215239 | 99     | 841     | 45    | 36.‎14238000 | -5.‎44235280 | 355    | 511     | 2016-07-28T05:52:32.000Z | 0101000020E6100000162DE521F8C415C060CD018239124240   

Также у меня есть индекс по полю the_geom:

CREATE INDEX samplecol_the_geom_gist ON samplecol USING gist (the_geom );  

Таблица создания:

CREATE TABLE samplecol
(
vessel_hash serial NOT NULL,
status character varying(50),
station character varying(50),
speed character varying(10),
latitude numeric(12,8),
longitude numeric(12,8),
course character varying(50),
heading character varying(50),
timestamp character varying(50),
the_geom geometry,
CONSTRAINT enforce_dims_the_geom CHECK (st_ndims(the_geom) = 2),
CONSTRAINT enforce_geotype_geom CHECK (geometrytype(the_geom) = 
'POINT'::text OR the_geom IS NULL),
CONSTRAINT enforce_srid_the_geom CHECK (st_srid(the_geom) = 4326) );

Проблема в том, что запрос выполняется слишком медленно.Время отклика для получения 745.902 баллов составляет 700 секунд.Я заметил, что postgis намного быстрее монго с использованием индекса.А в монго время отклика на тот же запрос составляет 90 секунд.Кто-нибудь знает, как можно улучшить этот запрос или что я делаю не так?

Ответы [ 2 ]

0 голосов
/ 11 июня 2018

@ JGH кажется, что время отклика меньше, но это не решает мою проблему.Я понял, что индекс gist будет использоваться, если я добавлю ST_Contains в where.Итак, мой запрос сейчас:

SELECT vessel_hash,ST_X(the_geom) AS long, ST_Y(the_geom) AS lat from samplecol where ST_Contains(ST_GeomFromEWKT('SRID=4326; POLYGON((17.2045898 37.3002753,17.2045898 37.2827946,17.0947266 35.5143431, 19.8413086 35.6215819,19.8193359 37.2827946,17.2045898 37.3002753))'),the_geom);

и время ответа составляет около 20 секунд.

0 голосов
/ 11 июня 2018

В запросе, скорее всего, не используется индекс, поскольку вы используете не столбец геометрии, а его производную.

Чтобы использовать индекс, не используйте ST_GeomFromEWKT(col.the_geom), а непосредственно col.the_geom

SELECT col.vessel_hash,
       ST_X(col.the_geom) AS long, 
       ST_Y(col.the_geom) AS lat, 
       ST_Contains(ST_GeomFromEWKT('SRID=4326; POLYGON((-28.828125 65.0721301,-28.125 64.7741253,-139.5703125 -47.0401821, 127.265625 -44.5904672,90 71.1877539,-28.828125 65.0721301))'),
          col.the_geom) 
FROM samplecol As col;
...