Как найти все страницы Википедии, относящиеся к названному объекту? - PullRequest
0 голосов
/ 04 мая 2020

Учитывая текст, я ищу ссылки на все страницы Википедии, относящиеся к именованным объектам, упомянутым в тексте. Есть ли надежный способ сделать это?

Например, рассмотрим текст:

Марк Эллиот Цукерберг - американский rnet предприниматель и филантроп.

"Учитывая это, я Я смотрю на вывод со следующими ссылками:

Возможно ли это в все, учитывая текущее состояние НЛП? Большое спасибо!

Ответы [ 2 ]

1 голос
/ 07 мая 2020

Как сказал вам @ Jindřich, вы, несомненно, должны взглянуть на связывание сущностей, иногда также на устранение неоднозначности (именованных) сущностей или «викификацию». Многое было сделано по этой теме в академических кругах (взгляните на задачи TA C, KBP, NEEL).

Многие программы делают это, и это лишь некоторые из них:

Имейте в виду, что результаты сильно зависят от типа текста, который вы обрабатываете, и что вам, вероятно, потребуется оценить надежность программного обеспечения перед их использованием.

1 голос
/ 05 мая 2020

Проблема, которую вы пытаетесь решить, называется Связывание сущностей . Существует множество научных c статей, в которых обсуждаются решения этой проблемы, но лишь немногие из них предоставляют реализацию.

OpenTapioka из Оксфорда имеет реализацию с открытым исходным кодом и онлайн-демонстрация .

SWAT от Пизанского университета имеет общедоступный API .

...