Преобразование HTML в RDF - PullRequest
       81

Преобразование HTML в RDF

5 голосов
/ 25 февраля 2010

Я ищу API общего назначения / веб-сервис / инструмент / и т. Д. ..., который позволяет преобразовывать данную HTML-страницу в граф RDF как можно более конкретно (наиболее вероятно, с использованием онтологии позвоночника и / или картографа) .

Ответы [ 3 ]

2 голосов
/ 09 апреля 2010

Я использовал XQuery для извлечения данных из заданного набора веб-страниц. Я должен был написать пользовательские запросы для веб-страниц. Я думаю, что это самый простой подход для конкретного набора файлов HTML. Тем не менее, это явно не хорошо для общего случая. Для другого набора веб-страниц необходимо написать другие пользовательские запросы.

2 голосов
/ 05 марта 2010

Вы доказали GRDDL ?

GRDDL - методика получения RDF данные из документов XML и в отдельные страницы XHTML.

0 голосов
/ 08 декабря 2013

Я использовал JSoup для очистки данных из HTML. Он использует стиль запросов jQuery для HTML DOM, с которым я уже был знаком, так что это был действительно простой инструмент для меня. Я также финансирую это довольно надежно, но мне нужно было просто очистить 3 источника данных, поэтому у меня пока нет богатого опыта с этим инструментом. jsoup

...