С помощью тега Stanford NER я могу извлечь всех ЛИЦ и ОРГАНИЗАЦИЙ, как и ожидалось.Вот краткий фрагмент:
ss=tagger.get_entities(text)
xorg=unique_list(ss.get('ORGANIZATION'))
xper=unique_list(ss.get('PERSON'))
out= (xorg,xperson)
#out is written to database
Мой вопрос заключается в том, как извлечь только те имена ЧЕЛОВЕКА, которые имеют отношение к именованной ОРГАНИЗАЦИИ?В частности, я хочу, чтобы выходные данные представляли собой триплет: ЧЕЛОВЕК, ОТНОШЕНИЕ, ОРГАНИЗАЦИЯ.
Для либо «Enron Chairman Kenneth Lay», либо «Kenneth Lay, председатель, Enron», я ожидаю, что результат будет читаться как (Kenneth Lay)(Председатель) (Enron).
Любая помощь будет полезна.