Извлечение сущностей из текста с использованием Базы знаний в Python - PullRequest
0 голосов
/ 17 октября 2019

У меня есть задачи по извлечению сущностей, которым нужны КБ, такие как wikidata, freebase, DBpedia. Учитывая их огромный размер, трудно загружать и извлекать сущности из них. Есть ли Python-клиент, который может делать вызовы API, чтобы получить извлечения через них с неструктурированным текстом в качестве ввода?

1 Ответ

0 голосов
/ 11 ноября 2019

По крайней мере, для DBPedia вы можете использовать DBPedia Spotlight, что-то вроде этого:

spotlight_url = 'http://api.dbpedia-spotlight.org/en/annotate?'
params = dict(text="Barack Obama was a president", confidence='0.2', support='10')
headers = {'Accept':'application/json'}
resp = requests_retry_session().get(url=spotlight_url, params=params,headers=headers)
results = resp.json()

Если бы вы выполняли множество запросов, у вас была бы локальная установка базы знаний в триплет-магазинеи локальная установка Spotlight тоже.

...