Я бы хотел импортировать файл json, содержащий мои данные, в Neo4J. Однако он очень медленный.
Файл Json структурирован следующим образом:
{
"graph": {
"nodes": [
{ "id": 3510982, "labels": ["XXX"], "properties": { ... } },
{ "id": 3510983, "labels": ["XYY"], "properties": { ... } },
{ "id": 3510984, "labels": ["XZZ"], "properties": { ... } },
...
],
"relationships": [
{ "type": "bla", "startNode": 3510983, "endNode": 3510982, "properties": {} },
{ "type": "bla", "startNode": 3510984, "endNode": 3510982, "properties": {} },
....
]
}
}
Это похоже на предложенный здесь: Как восстановить данные из предыдущий результат в браузере? .
Глядя на ответ. Я обнаружил, что могу использовать
CALL apoc.load.json("file:///test.json") YIELD value AS row
WITH row, row.graph.nodes AS nodes
UNWIND nodes AS node
CALL apoc.create.node(node.labels, node.properties) YIELD node AS n
SET n.id = node.id
, а затем
CALL apoc.load.json("file:///test.json") YIELD value AS row
with row
UNWIND row.graph.relationships AS rel
MATCH (a) WHERE a.id = rel.endNode
MATCH (b) WHERE b.id = rel.startNode
CALL apoc.create.relationship(a, rel.type, rel.properties, b) YIELD rel AS r
return *
(я должен сделать это два раза, потому что в противном случае они являются дублированием отношений из-за двух unwind
).
Но это очень медленно, потому что у меня много сущностей, и я подозреваю, что программа ищет их по всем отношениям.
В то же время я знаю, что "startNode": 3510983
относится в узел. Поэтому вопрос: существует ли он в любом случае для ускорения процесса импорта с использованием идентификаторов в качестве индекса или чего-то еще?
Обратите внимание, что мои узлы имеют разные типы. Поэтому я не нашел способ создать индекс для всех из них, и я полагаю, что он будет слишком большим (память)