TinkerPop на самом деле не предоставляет инструментов для массовой загрузки и полагается на встроенные функции графических баз данных для предоставления такой функциональности. Единственный инструмент массовой загрузки, который есть у TinkerPop - это BulkLoaderVertexProgram , который можно использовать для загрузки больших графиков в параллельном распределенном режиме. Кроме этого (особенно если у вас нет большого графика), вы просто написали бы скрипт Gremlin для чтения ваших исходных данных, а затем с помощью шагов мутации Gremlin (то есть addV()
и addE()
) загрузили данные в ваш граф. Если вы загружаете один раз, я бы просто запустил такой скрипт из консоли Gremlin и сгенерировал ваш график.
Итак, опять три варианта:
- Напишите сценарий Gremlin, который будет выполняться в консоли Gremlin для загрузки ваших данных.
- Если у вас особенно большой график, рассмотрите
BulkLoaderVertexProgram
и Hadoop / Spark
- Рассмотрим инструменты массовой загрузки, доступные для выбранной вами графической базы данных.
Какой бы выбор вы ни сделали, сначала загрузите, а затем подключите этот график к Gremlin Server. В этот момент вы можете запросить загруженные данные с помощью gremlin-python.
Вам может пригодиться эта колода слайдов из выступления Джейсона Плурада: "Powers of Ten Redux" , основанного на оригинальной работе, которую я сделал с Дэниелом Куппитцем в серии постов в блоге "Powers of Ten" для данных загрузка.