Я импортировал свой набор данных с помощью инструмента импорта Neo4j. Результат выглядит так:
IMPORT DONE in 3m 4s 715ms.
Imported:
9252082 nodes
12347926 relationships
100924808 properties
Peak memory usage: 604.47 MB
Таким образом, общее количество узлов превышает 9 миллионов узлов. Я получил тот же результат, когда подсчитал строки фреймов данных Spark из файлов CSV, в которых хранятся данные.
Однако когда я выполняю этот запрос в Neo4j, я получаю меньшее число:
MATCH (n) return count(*)
Итоговый счет: 4446119
Я проверил, что количество записей отличается только для одной конкретной таблицы, которая является самой большой. Таким образом, в Neo4j вместо 5893886
счет для этой таблицы равен 1087923
Итак, согласно результатам импорта, кажется, что все узлы импортированы, но эту тенденцию нельзя увидеть в Neo4j.
В чем может быть причина такого поведения?