функция кросс-таблицы в postgresql вызывает неверный размер запроса на выделение памяти - PullRequest
0 голосов
/ 10 октября 2018

PostgreSQL 9.5.10, ОЗУ = 8 ГБ

У меня есть таблица с тремя столбцами (ID, Категория, anzahl (= Количество)).таблица имеет около 132 миллионов строк.В столбце категории 58 уникальных значений: 58 различных категорий.

Как и в примере, показанном здесь PostgreSQL Crosstab Query Я хочу создать сводную таблицу, в которой у меня есть ID и 58 категорий в качестве столбцов (то есть во всех 59 столбцах) и строка, заполненная соответствующими значениями Count.ниже приведен запрос:

select * into sde.demographie100m_transposed

from crosstab(
'select gitter_id_100m, category, anzahl
from sde.demographie100m_3col
order by 1,2',

'select distinct category from sde.demographie100m_3col order by 1'
) 


AS ct
("gitter_id_100m" text,
"INSGESAMT_Einheiten insgesamt" integer, 
"ALTER_10JG_10 - 19" integer, 
"ALTER_10JG_20 - 29" integer, 
"ALTER_10JG_30 - 39" integer, 
"ALTER_10JG_40 - 49" integer, 
"ALTER_10JG_50 - 59" integer, 
"ALTER_10JG_60 - 69" integer, 
"ALTER_10JG_70 - 79" integer, 
"ALTER_10JG_80 und älter" integer, 
"ALTER_10JG_Unter 10" integer, 
"ALTER_KURZ_18 - 29" integer, 
"ALTER_KURZ_30 - 49" integer, 
"ALTER_KURZ_50 - 64" integer, 
"ALTER_KURZ_65 und älter" integer, 
"ALTER_KURZ_Unter 18" integer, 
"FAMSTND_AUSF_Eingetr. Lebenspartner/-in verstorben" integer, 
"FAMSTND_AUSF_Eingetr. Lebenspartnerschaft" integer, 
"FAMSTND_AUSF_Eingetr. Lebenspartnerschaft aufgehoben" integer, 
"FAMSTND_AUSF_Geschieden" integer, 
"FAMSTND_AUSF_Ledig" integer, 
"FAMSTND_AUSF_Ohne Angabe" integer, 
"FAMSTND_AUSF_Verheiratet" integer, 
"FAMSTND_AUSF_Verwitwet" integer, 
"GEBURTLAND_GRP_Deutschland" integer, 
"GEBURTLAND_GRP_EU27-Land" integer, 
"GEBURTLAND_GRP_Sonstige" integer, 
"GEBURTLAND_GRP_Sonstige Welt" integer, 
"GEBURTLAND_GRP_Sonstiges Europa" integer, 
"GESCHLECHT_Männlich" integer, 
"GESCHLECHT_Weiblich" integer, 
"RELIGION_KURZ_Evangelische Kirche (öffentlich-rechtlich)" integer, 
"RELIGION_KURZ_Römisch-katholische Kirche (öffentlich-rechtlich)" integer, 
"RELIGION_KURZ_Sonstige, keine, ohne Angabe" integer, 
"STAATSANGE_GRP_Deutschland" integer, 
"STAATSANGE_GRP_EU27-Land" integer, 
"STAATSANGE_GRP_Sonstige" integer, 
"STAATSANGE_GRP_Sonstige Welt" integer, 
"STAATSANGE_GRP_Sonstiges Europa" integer, 
"STAATSANGE_HLND_Bosnien und Herzegowina" integer, 
"STAATSANGE_HLND_Deutschland" integer, 
"STAATSANGE_HLND_Griechenland" integer, 
"STAATSANGE_HLND_Italien" integer, 
"STAATSANGE_HLND_Kasachstan" integer, 
"STAATSANGE_HLND_Kroatien" integer, 
"STAATSANGE_HLND_Niederlande" integer, 
"STAATSANGE_HLND_Österreich" integer, 
"STAATSANGE_HLND_Polen" integer, 
"STAATSANGE_HLND_Rumänien" integer, 
"STAATSANGE_HLND_Russische Föderation" integer, 
"STAATSANGE_HLND_Sonstige" integer, 
"STAATSANGE_HLND_Türkei" integer, 
"STAATSANGE_HLND_Ukraine" integer, 
"STAATSANGE_KURZ_Ausland" integer, 
"STAATSANGE_KURZ_Deutschland" integer, 
"STAATZHL_Eine Staatsangehörigkeit" integer, 
"STAATZHL_Mehrere Staatsangehörigkeiten, deutsch und ausländisch" integer, 
"STAATZHL_Mehrere Staatsangehörigkeiten, nur ausländisch" integer, 
"STAATZHL_Nicht bekannt" integer

);

, но он приводит к ошибке, как показано ниже:

ERROR: invalid memory alloc request size 1073741824
SQL Status:XX000
Kontext:SQL statement "select gitter_id_100m, category, anzahl
from sde.demographie100m_3col
order by 1,2"

1 Ответ

0 голосов
/ 10 октября 2018

Вместо этого попробуйте каноническую форму:

SELECT gitter_id_100m,
  SUM(CASE when category='INSGESAMT_Einheiten insgesamt' then anzahl END) AS "INSGESAMT_Einheiten insgesamt",
  SUM(CASE when category='ALTER_10JG_10 - 19' then anzahl END) AS "ALTER_10JG_10 - 19",
  ...etc...
 FROM sde.demographie100m_3col
 GROUP BY 1
 ORDER BY 1; -- remove the ORDER BY if you can do without it.

Предположительно, эта форма будет гораздо проще (чем кросс-таблица) для сервера выплескиваться на диск при необходимости, а не генерировать весь результат в памяти.

Вы также можете использовать курсор SQL для получения результата в виде фрагментов.В некоторых случаях это может очень помочь с потреблением памяти, как на стороне клиента, так и на стороне сервера.

Код на стороне клиента для использования курсора:

BEGIN;  -- open transaction
  DECLARE mycursor CURSOR FOR SELECT ... rest of the query;
  FETCH mycursor;   -- retrieve 1 line
  -- FETCH mycursor repeatedly
  CLOSE mycursor;
COMMIT;

Также есть функция dynamic_pivot на github, которую можно использовать для автоматизации вышеперечисленного (создает сводный запрос и возвращает на него курсор), но я не уверен, как его реализация будет вести себя с точки зрения производительности со строками 132M.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...