neo4j читать столбчатые данные паркета - PullRequest
0 голосов
/ 20 октября 2019

Может ли neo4j каким-либо образом считывать файлы паркета напрямую?

У меня есть крайний список с примерно 20 миллионами записей в день, и я бы хотел его проглотить.

Макет похож на:

id,srd,dst,timestamp,weight,rel_kind

И с использованием обычногоCSV не звучит оптимально.

1 Ответ

0 голосов
/ 21 октября 2019

Если обычным образом вы имеете в виду команду Neo4j LOAD CSV, что конкретно не кажется оптимальным? Я использовал его для загрузки очень больших CSV-файлов в версию для сообщества, и он работал нормально.

При работе с CSV-форматом такого размера вы должны быть уверены, что будете использовать периодические коммиты, чтобы удерживать транзакцию отне хватает памяти. Вот пример вырезания / вставки со страницы документации LOAD CSV :

USING PERIODIC COMMIT 500
LOAD CSV FROM 'https://neo4j.com/docs/cypher-manual/3.5/csv/artists.csv' AS line
CREATE (:Artist { name: line[1], year: toInteger(line[2])})

Я обычно использую гораздо большие значения, чем 500, больше как 10000 или 20000, для чего бы это ни стоило.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...