Загрузка большого количества данных в Postgres Hstore - PullRequest
10 голосов
/ 19 марта 2012

В документации hstore говорится только об использовании "insert" в hstore по одной строке за раз.Можно ли в любом случае выполнить массовую загрузку нескольких строк по 100 тыс., Которые могут быть мегабайтами или гигабайтами в хранилище postgres.

Кажется, что команды копирования работают только для загрузки столбцов csv-файлов

Может кто-то опубликоватьпример ?Желательно решение, которое работает с python / psycopg

Ответы [ 3 ]

6 голосов
/ 17 июля 2012

Приведенные выше ответы кажутся неполными в том, что если вы пытаетесь скопировать в несколько столбцов, включая столбец с типом hstore, и используете разделитель запятых, COPY запутывается, например:

$ cat test
1,a=>1,b=>2,a
2,c=>3,d=>4,b
3,e=>5,f=>6,c

create table b(a int4, h hstore, c varchar(10));
CREATE TABLE;
copy b(a,h,c) from 'test' CSV;
ERROR:  extra data after last expected column
CONTEXT:  COPY b, line 1: "1,a=>1,b=>2,a"

Аналогично:

copy b(a,h,c) from 'test' DELIMITER ',';
ERROR:  extra data after last expected column
CONTEXT:  COPY b, line 1: "1,a=>1,b=>2,a"

Это можно исправить, импортировав как CSV и указав поле для импорта в hstore:

$ cat test
1,"a=>1,b=>2",a
2,"c=>3,d=>4",b
3,"e=>5,f=>6",c

copy b(a,h,c) from 'test' CSV;
COPY 3
select h from b;
         h          
--------------------
 "a"=>"1", "b"=>"2"
 "c"=>"3", "d"=>"4"
 "e"=>"5", "f"=>"6"
(3 rows)

Цитирование разрешено только в формате CSV, поэтому импорт какТребуется CSV, но вы можете явно установить разделитель поля и символ кавычки в значения, отличные от ',' и '", используя аргументы DELIMITER и QUOTE для COPY.

3 голосов
/ 19 марта 2012

мне кажется, что и вставка, и копирование работают естественным образом

create table b(h hstore);
insert into b(h) VALUES ('a=>1,b=>2'::hstore), ('c=>2,d=>3'::hstore);
select * from b;
         h          
--------------------
 "a"=>"1", "b"=>"2"
 "c"=>"2", "d"=>"3"
(2 rows)

$ cat > /tmp/t.tsv
a=>1,b=>2
c=>2,d=>3
^d

copy b(h) from '/tmp/t.tsv';
select * from b;
         h          
--------------------
 "a"=>"1", "b"=>"2"
 "c"=>"2", "d"=>"3"
 "a"=>"1", "b"=>"2"
 "c"=>"2", "d"=>"3"
(4 rows)
0 голосов
/ 31 июля 2014

Вы определенно можете сделать это с помощью команды copy binary.

Мне неизвестна библиотека Python, которая может это сделать, но у меня есть ruby, который может помочь вам понять кодировки столбцов.

https://github.com/pbrumm/pg_data_encoder

...