Индексирование Dbpedia для связывания именованных сущностей (чатбот) - PullRequest
0 голосов
/ 29 марта 2019

Я работаю над проектом для чат-бота.Чатбот должен отвечать на вопросы пользователей, используя dbpedia, и первоначально прошел обучение в службе поддержки IBM watson.Однако в этом сервисе необходимо вручную заполнить словари, в которых определены объекты dbpedia и их синонимы.Объекты, определенные в словарях, - это объекты, которые распознаются в вопросах естественного языка пользователя.

Например, в вопросе "Кто является директором" Человека-паука "?"чатбот распознает dbo: Director и сущность Spiderman, потому что они определены в словаре.

Ручная вставка всех сущностей dbpedia в словари является ограничением, и на данный момент чатбот распознает только несколько сущностей, включенных в словарь..

Поэтому я хочу распознать сущности dbpedia, присутствующие в вопросах естественного языка, написанных пользователем, используя индексацию наборов данных dbpedia rdf для чего-то вроде Elasticsearch или Lucene, а затем используя полнотекстовый поиск.Я думал об индексировании сущностей, используя только буквальные свойства dbpedia (чтобы использовать полнотекстовый поиск).Прежде чем продолжить, я хотел бы знать, является ли это правильным подходом, и дать несколько советов о том, как приступить к настройке индексов и как эффективно использовать полнотекстовый поиск.

Спасибо

...