я получаю новый проект, который предназначен для моего последнего года по классификации текста с использованием semanti c, особенно я работаю с онтологией. Итак, что я планировал: когда вы делаете запрос в поле (например, поисковая система Google), вы получите результат, который вы хотите. сфера охвата - это область исследований по моей специальности, поэтому когда вы введете название исследования, оно должно показать, над какой областью вы работаете.
Я создал онтологию и сохранил ее как TTL и RDF. , мой руководитель сказал мне, что я должен проиндексировать общий текст с помощью Lucene и преобразовать (или изменить его) в RDF, чтобы я мог сравнить его с моим RDF. Я сделал несколько примеров программ с использованием Jena и Lucene, но большинство из них все еще используют внешний контент, такой как формат TXT.
Возможно ли это сделать? или я могу получить ссылки? пожалуйста, посоветуй мне. Большое спасибо.
ps: я пытаюсь разработать его с Eclipse IDE