Как сохранить символ новой строки при выполнении команды psql copy - PullRequest
0 голосов
/ 13 июня 2018

У меня есть следующий контент в моем файле csv (с 3 столбцами):

141413,"\"'/x=/></script></title><x><x/","Mountain View, CA\"'/x=/></script></title><x><x/"

148443,"CLICK LINK BELOW TO ENTER^^^^^^^^^^^^^^","model\
\
xxx lipsum as it is\
\
100 sometimes unknown\
\
travel evening market\
"

Когда я импортирую вышеупомянутый csv в mysql, используя следующую команду, он обрабатывает обратную косую черту () как новую строку;что является ожидаемым поведением.

LOAD DATA INFILE '1.csv' INTO TABLE users FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '\"' LINES TERMINATED BY '\n';

Вывод MYSQL

Но когда я пытаюсь импортировать в psql с помощью команды копирования, он обрабатывает \ как обычный символ.

copy users from '1.csv' WITH (FORMAT csv, DELIMITER ',', ENCODING 'utf8', NULL "\N", QUOTE E'\"', ESCAPE '\');

postgres Выход

1 Ответ

0 голосов
/ 13 июня 2018

Попробуйте проанализировать эти \ перед импортом файла CSV, например, используя perl -pe или sed и STDIN из psql:

$ cat 1.csv | perl -pe 's/\\\n/\n/g' | psql testdb -c "COPY users FROM STDIN WITH (FORMAT csv, DELIMITER ',', ENCODING 'utf8', NULL "\N", QUOTE E'\"', ESCAPE '\');"

Thisкак выглядит после импорта:

testdb=# select * from users;
   id   |                 company                 |                    location                     
--------+-----------------------------------------+-------------------------------------------------
 141413 | "'/x=/></script></title><x><x/          | Mountain View, CA"'/x=/></script></title><x><x/
 148443 | CLICK LINK BELOW TO ENTER^^^^^^^^^^^^^^ | model                                          +
        |                                         |                                                +
        |                                         | xxx lipsum as it is                            +
        |                                         |                                                +
        |                                         | 100 sometimes unknown                          +
        |                                         |                                                +
        |                                         | travel evening market                          +
        |                                         | 
(2 Zeilen)
...