Как читать контакты в формате hCard из файла .html, чтобы добавить их в модель (с использованием инфраструктуры Jena) - PullRequest
0 голосов
/ 26 декабря 2018

Мне нужно кодировать приложение Java, которое считывает имена некоторых контактов со страницы .html , записанной с помощью микроформата hCard , чтобы добавить их в существующую модель.Мое первое сомнение в том, что я не уверен в источнике, из которого мне нужно читать: в упражнении говорится, что это должна быть «страница html», и я не знаю, должен ли это быть сайт или простофайл .html (и я не знаю, должен ли один из этих вариантов быть исключен априори, очевидно).В настоящее время я пишу на Java (на Eclipse), используя библиотеки, предоставляемые Jena framework .Я знаю, как создать модель и как добавить некоторые тройки в модель, как «вручную» (используя Model.createResource (), Model.addProperty () и аналогичные методы), так и читая их изФайл .rdf (с методом Model.read ()), но это .html «осложнение» блокирует меня.

Я попытался использовать следующую строку кода, но она не работает, что выдает мне следующую ошибку: Исключение в потоке "main" org.apache.jena.riot.RiotException: [line: 2, col:36] {E201} Атрибуты этого элемента свойства запрещены для любого содержимого;тег ожидаемого конечного элемента.

Model model = ModelFactory.createDefaultModel();
model.read("contactPage.html");

Что мне попробовать?Я думал о кодировании парсера, но учитывая небольшую важность этого упражнения в проекте, в которое оно было вставлено, я не думаю, что решение должно быть настолько сложным, возможно, оно уже существует.

...