Gremlin-сервер создает график, загружая данные из CSV-файлов из gremlin-python - PullRequest
0 голосов
/ 26 апреля 2018

Я нашел руководство по созданию графа с использованием файлов данных csv с использованием groovy. (https://github.com/vsantosu/gremlin-importer/wiki/CSV-import-guide)

Скажем, я хочу создать этот чудо-график супергероев (или любой другой граф по этому вопросу) на gremlin-сервере, используя gremlin-python. Как я могу это сделать?

Я ничего не могу придумать и тоже не нашел ничего полезного. Так что я почти пуст с этим вопросом

1 Ответ

0 голосов
/ 26 апреля 2018

TinkerPop на самом деле не предоставляет инструментов для массовой загрузки и полагается на встроенные функции графических баз данных для предоставления такой функциональности. Единственный инструмент массовой загрузки, который есть у TinkerPop - это BulkLoaderVertexProgram , который можно использовать для загрузки больших графиков в параллельном распределенном режиме. Кроме этого (особенно если у вас нет большого графика), вы просто написали бы скрипт Gremlin для чтения ваших исходных данных, а затем с помощью шагов мутации Gremlin (то есть addV() и addE()) загрузили данные в ваш граф. Если вы загружаете один раз, я бы просто запустил такой скрипт из консоли Gremlin и сгенерировал ваш график.

Итак, опять три варианта:

  1. Напишите сценарий Gremlin, который будет выполняться в консоли Gremlin для загрузки ваших данных.
  2. Если у вас особенно большой график, рассмотрите BulkLoaderVertexProgram и Hadoop / Spark
  3. Рассмотрим инструменты массовой загрузки, доступные для выбранной вами графической базы данных.

Какой бы выбор вы ни сделали, сначала загрузите, а затем подключите этот график к Gremlin Server. В этот момент вы можете запросить загруженные данные с помощью gremlin-python.

Вам может пригодиться эта колода слайдов из выступления Джейсона Плурада: "Powers of Ten Redux" , основанного на оригинальной работе, которую я сделал с Дэниелом Куппитцем в серии постов в блоге "Powers of Ten" для данных загрузка.

...