Только что начал с Tinkerpop и Janusgraph, и я пытаюсь выяснить это на основе документации.
- У меня есть три набора данных, каждый из которых содержит около 20 миллионов строк (CSV-файлы)
- Существует конкретная модель, в которой необходимо связать переменные и строки, например, что такое вершины, что такое метки, что такое ребра и т. Д.
- После того, как все в графе, яКонечно, я хотел бы использовать базовый Gremlin, чтобы увидеть, насколько хорошо работает модель.
Но сначала мне нужен способ получить данные в Janusgraph.
Возможно, существуют сценарииза это.Но в противном случае, возможно, это что-то написанное на python, чтобы открыть файл csv, получить каждую строку переменной X и добавить это как вершину / ребро / и т.д....?Или я полностью неверно истолковал Janusgraph / Tinkerpop?
Спасибо за любую помощь заранее.
РЕДАКТИРОВАТЬ:
Скажем, у меня есть несколько файлов, каждый из которых содержит несколько миллионовстроки, представляющие людей, и несколько переменных, представляющих различные метрики.Первый пример может выглядеть так: thid:
metric_1 metric_2 metric_3 ..
person_1 a e i
person_2 b f j
person_3 c g k
person_4 d h l
..
Должен ли я преобразовать это в файлы с узлами, которые в первую очередь состоят только из значений, [a, ..., l].(а позже, возможно, более сложные наборы свойств)
И индексируются ли [a, ..., l]?
График 'Modern' здесь , кажется, имеет индекс (число 1, ..., 12 для всех узлов и ребер, независимо от их перекрывающейся метки / категории), например, долженкаждое измерение индексируется отдельно, а затем связывается с данным person_x, к которому они относятся?
Извиняюсь за эти, вероятно, простые вопросы, но я довольно новичок в этом.