У меня большой rdf-файл:
- размер: 470 МБ
- количество строк: почти 6 миллионов
- уникальных тройных предметов: около 650 000
- тройная сумма: около 4 200 000
Я хочу загрузить это определение rdf в собственное хранилище rdf на своем ноутбуке.
Характеристики компьютера:
- Процессор Intel B980
- RAM: 4 ГБ
- нет SSD
- свободного места на жестком диске: ~ 8 ГБ
Я решил использовать Jena Fuseki,
скачал последнюю версию:
http://mirror.dkd.de/apache/jena/binaries/apache-jena-fuseki-3.12.0.tar.gz
запустил Fuseki:
java -Xmx1200M -jar fuseki-server.jar
и загрузил определение rdf через веб-интерфейс:
http://localhost:3030/dataset.html?tab=upload&ds=/gnd
В соответствии с индикатором выполнения процесс анализа / импорта сначала продвигался довольно быстро, затем постепенно становился медленнее, останавливался примерно через 15 минут (примерно на 50%) и через 20 минут начинался заново.
Итак, мои вопросы:
Разве характеристики моего компьютера не подходят для такого большого размера файла rdf? Есть ли эмпирическое правило относительно требований?
Существуют ли альтернативы / лучшие способы импорта данных в Fuseki? Может быть, кусками?