Question

У меня большой rdf-файл:

размер: 470 МБ
количество строк: почти 6 миллионов
уникальных тройных предметов: около 650 000
тройная сумма: около 4 200 000

Я хочу загрузить это определение rdf в собственное хранилище rdf на своем ноутбуке.

Характеристики компьютера:

Процессор Intel B980
RAM: 4 ГБ
нет SSD
свободного места на жестком диске: ~ 8 ГБ

Я решил использовать Jena Fuseki,

скачал последнюю версию:

http://mirror.dkd.de/apache/jena/binaries/apache-jena-fuseki-3.12.0.tar.gz

запустил Fuseki:

java -Xmx1200M -jar fuseki-server.jar

и загрузил определение rdf через веб-интерфейс:

http://localhost:3030/dataset.html?tab=upload&ds=/gnd

В соответствии с индикатором выполнения процесс анализа / импорта сначала продвигался довольно быстро, затем постепенно становился медленнее, останавливался примерно через 15 минут (примерно на 50%) и через 20 минут начинался заново.

Итак, мои вопросы:

Разве характеристики моего компьютера не подходят для такого большого размера файла rdf? Есть ли эмпирическое правило относительно требований?

Существуют ли альтернативы / лучшие способы импорта данных в Fuseki? Может быть, кусками?

Системные требования и альтернативы загрузке RDF в Jena Fuseki

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Системные требования и альтернативы загрузке RDF в Jena Fuseki

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы