Загрузка отношений из файла tsv не работает на neo4j - PullRequest
0 голосов
/ 27 октября 2019

Я пытаюсь импортировать отношения из файла tsv в neo4j с более чем 1 000 000 строк. Мне удалось успешно импортировать файл узла с 23 000 узлов за считанные секунды. Тем не менее, когда я пытаюсь импортировать файл отношений tsv, neo4j занимает много времени, вычисляя этот файл (несколько часов) только для того, чтобы сказать: «без изменений не создано никаких отношений». Я не знаю, правильно ли я это делаю, потому что я довольно новичок в neo4j.

Я использую версию сообщества neo4j.

The node file that is imported into neo4j looks like this: 

id      name    kind
Anatomy::UBERON:0000002 uterine cervix  Anatomy
Anatomy::UBERON:0000004 nose    Anatomy
Anatomy::UBERON:0000006 islet of Langerhans Anatomy

The relationship file looks like: 

source  metaedge    target
Gene::801       GiG     Gene::7428
Gene::5987      GiG     Gene::9412
Gene::5747      GiG     Gene::79738



//how im trying to link the relationships

using periodic commit 
LOAD CSV WITH HEADERS FROM 'file:///edges.tsv' as edges FIELDTERMINATOR'\t' 
MATCH (a:myNodes{name:edges.source})
MATCH(b:myNodes{name:edges.target})
CREATE (a)-[:CONNECTED{metaedge:edges.metaedge}]->(b)    


Don't know how to make this work and speed up the process as well.

1 Ответ

0 голосов
/ 28 октября 2019

С помощью
ИСПОЛЬЗОВАНИЕ PERIODIC COMMIT вы должны указать значение

Это значение зависит от наличия оперативной памяти для Neo4j. Это значение может быть установлено в neo4j.conf

Кроме того, есть ли у вас ограничения unicity для имени для myNodes?

Я бы посоветовал запускать импорт не из веб-приложения, а из CLI,И запустить автономный сервер (не настольный компьютер), если у вас ограничено ОЗУ

Запуск другого инструмента для просмотра загрузки ОЗУ, загрузки ЦП, загрузки диска может помочь вам найти правильные настройки для импорта.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...