Есть ли способ ускорить загрузку CSV с 120M отношениями в 10M узлы, избегая декартового произведения в Neo4j? - PullRequest
0 голосов
/ 08 июня 2019

Я пытаюсь создать 120M отношений между 10M узлами (: дома). Я уже создал все узлы (: Homes) и создал индекс для (: Homes) .id.

CREATE INDEX ON :Homes(id)

Это мой код для вставки в базу данных из локального файла CSV. Каждая строка в файле CSV имеет home1_id и home2_id, и я пытаюсь создать отношение home1 --> home2

USING PERIODIC COMMIT 50000
LOAD CSV WITH HEADERS FROM "file:///relationships.csv" AS row
MATCH (home1:Homes {id: toInteger(row.home1_id)}),(home2:Homes {id: toInteger(row.home2_id)})
CREATE (home1)-[:Recommends]->(home2)

Запуск этого в настоящее время кажется, что это займет 1-2 часа. Могу ли я сделать какие-либо оптимизации?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...