Ошибка загрузки DBPedia Turtle в Virtuoso с помощью Docker - PullRequest
0 голосов
/ 14 февраля 2019

Я загрузил файлы черепах DBPedia с их структурой извлечения (https://github.com/dbpedia/extraction-framework).

Затем я использовал образ докера tenforce/virtuoso:1.3.2-virtuoso7.2.2 после извлечения всех ttl.bz2 в папку toLoad.

После полной загрузки я проверил isql с select * from DB.DBA.LOAD_LIST; и получил ошибку в одном из файлов:

2 2019.2.2 11: 31.43 69876000 2019.2.2 11: 31.44 521623000 0NULL 37000 [Векторизованный загрузчик черепахи] SP029: Загрузчик TURTLE RDF, строка 172395: синтаксическая ошибка

Конечная точка виртуоза (http://localhost:8890/sparql) подключена, но запросы не возвращают правильные результаты.

Знаете ли вы, что я могу сделать, чтобы исправить эту ошибку?

ОБНОВЛЕНИЕ: более новые tenforce/virtuoso:1.3.2-virtuoso7.2.5.1 и openlink/virtuoso-opensource-7 также были протестированы, давая тот же результат.

ОБНОВЛЕНИЕ 2: Строка 172395 этого файла выглядит нормально: <http://pt.dbpedia.org/resource/Reino_de_Roma> <http://dbpedia.org/ontology/governmentType> <http://pt.dbpedia.org/resource/Monarquia> <http://pt.wikipedia.org/wiki/Reino_de_Roma?oldid=53119289&ns=0> .

1 Ответ

0 голосов
/ 14 февраля 2019

Как я уже говорил в ваш дубликат поста на github -

Я бы начал с использования tenforce/virtuoso:latest или tenforce/virtuoso:virtuoso7.2.5 или tenforce/virtuoso:1.3.2-virtuoso7.2.5, все из которых должны основываться на Virtuoso 7.2.5.1 (с августа 2018 г.) , а не на довольно пожилом tenforce/virtuoso:1.3.2-virtuoso7.2.2, который основан на аналогично пожилом Virtuoso 7.2.2 (с декабря2015) .

...