Извлечь личную информацию о человеке из списка документов и обобщить ее - PullRequest
0 голосов
/ 07 марта 2019

Мне нужно извлечь личную информацию о человеке из списка документов и обобщить ее для пользователя.Если есть 2 человека с одинаковыми именами, следует указать правильного человека.Если у человека есть псевдоним, его также необходимо идентифицировать.Входными данными для программы могут быть имя человека, адрес, название организации и т. Д. Я извлек именованные объекты, такие как человек, организация, местоположение и т. Д., Из текста с использованием библиотеки NLTK.Выходные данные после извлечения именованных сущностей упомянуты ниже,

[('Michael', 'NNP', 'B-PERSON'), ('Joseph', 'NNP', 'B-PERSON'),('Джексон', 'NNP', 'Я-ЧЕЛОВЕК'), ('was', 'VBD', 'O'), ('born', 'VBN', 'O'), ('in', 'IN ',' O '), (' Gary ',' NNP ',' B-GPE '), (', ',', ',' O '), (' Indiana ',' NNP ',' B-GPE ') ....

Теперь я хочу извлечь отношения между этими сущностями.

1 Ответ

1 голос
/ 07 марта 2019

Ваша задача действительно связана с извлечением информации из НЛП.Посмотрите здесь, чтобы получить обзор будет лучше. Stanford Извлечение информации .

Кроме того, при наличии дублированных имен, метод именования сущностей может решить эту проблему.

В качестве условия также может помочь название документов.когда вы хотите вывести более точный результат.

Это пример извлечения информации в НЛП.Надеюсь, это поможет!

enter image description here

...