Как обнаружить ошибки в IRI в файле RDF? - PullRequest
0 голосов
/ 07 января 2019

Я пытаюсь сделать корректор RDF. Одна из вещей, которые я специально хочу исправить, это IRI. Мой вопрос заключается в том, что независимо от формата RDF я могу что-нибудь сделать, чтобы исправить ошибки в IRI? Я понимаю, что может быть несколько ошибок, но какие из наиболее общих ошибок я могу исправить?

Я использую ANTLR, чтобы сделать корректор. Я расширил BaseErrorListener, чтобы он выдавал ошибки, сделанные в частности в IRI.

1 Ответ

0 голосов
/ 07 января 2019

По моему опыту, ошибки, сделанные в реальном мире, зависят от источника. Источник может систематически создавать IRI с пробелами или был скопирован в двоичном формате между ISO-8859-1 («латинский») и UTF-8 (правильный формат), что портит UTF-8. Эти ошибки низкого уровня лучше всего исправить с помощью текстового редактора во входном файле (и исправить код, генерирующий их).

Попробуйте несколько примеров IRI на http://www.sparql.org/iri-validator.html,, которые выводят предупреждения и ошибки и имеют тот же код, что и парсеры.

...