Я экспериментирую с использованием проекта pg_bulkload для импорта миллионов строк данных в базу данных. Однако ни одна из новых строк не имеет первичного ключа, и только два из нескольких столбцов доступны в моем входном файле. Как мне сообщить pg_bulkload, какие столбцы я импортирую, и как мне сгенерировать поле первичного ключа? Нужно ли мне редактировать мой файл импорта, чтобы он точно соответствовал выводу команды COPY, и сам генерировал поле id
?
Например, допустим, столбцы моей базы данных могут быть:
id title body published
Имеющиеся у меня данные ограничены title
и published
и перечислены в файле с разделителями табуляции. Мой .ctl
файл выглядит так:
TABLE = posts
INFILE = stdin
TYPE = CSV
DELIMITER = " "