Модель связывания предварительно обученных сущностей для Википедии / WikiData - PullRequest
1 голос
/ 15 марта 2020

У меня есть несколько 34000 обзоров ресторанов на английском языке, чтобы выполнить связывание сущностей, и я ищу какое-то масштабируемое решение.

Есть ли какая-то предварительно обученная модель для связывания сущностей с Wikipedi / WikiData KB?

  • Spacy недавно начал поддерживать Entity Linking 1 , 2 , 3 , но они не предоставляют предварительно подготовленную модель для этого и некоторых людей. report обучение занимает не менее недели .
  • Wikifier имеет предварительно обученную модель, которую можно использовать для связывания сущностей через службу REST, но я не знаю, что их предел скорости для моего количества текстов и как он масштабируется. Следовательно, я бы предпочел автономное решение.

1 Ответ

0 голосов
/ 09 апреля 2020

Для загрузки доступны две реализации, Illinois Wikifier 1.0 и 2.0 здесь , описанные в следующих публикациях

Я попробовал первый и получил хорошие результаты. Это определенно не готовое к работе программное обеспечение: иногда проблемы с памятью накапливаются, что приводит к Java проблемам с кучей памяти, но я смог добавить возможность возобновления сбойных задач, и теперь она прекрасно работает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...