Системные требования и альтернативы загрузке RDF в Jena Fuseki - PullRequest
0 голосов
/ 14 июня 2019

У меня большой rdf-файл:

  • размер: 470 МБ
  • количество строк: почти 6 миллионов
  • уникальных тройных предметов: около 650 000
  • тройная сумма: около 4 200 000

Я хочу загрузить это определение rdf в собственное хранилище rdf на своем ноутбуке.

Характеристики компьютера:

  • Процессор Intel B980
  • RAM: 4 ГБ
  • нет SSD
  • свободного места на жестком диске: ~ 8 ГБ

Я решил использовать Jena Fuseki,

скачал последнюю версию:

http://mirror.dkd.de/apache/jena/binaries/apache-jena-fuseki-3.12.0.tar.gz

запустил Fuseki:

java -Xmx1200M -jar fuseki-server.jar

и загрузил определение rdf через веб-интерфейс:

http://localhost:3030/dataset.html?tab=upload&ds=/gnd

В соответствии с индикатором выполнения процесс анализа / импорта сначала продвигался довольно быстро, затем постепенно становился медленнее, останавливался примерно через 15 минут (примерно на 50%) и через 20 минут начинался заново.

Итак, мои вопросы:

Разве характеристики моего компьютера не подходят для такого большого размера файла rdf? Есть ли эмпирическое правило относительно требований?

Существуют ли альтернативы / лучшие способы импорта данных в Fuseki? Может быть, кусками?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...