Как разработать Name Entity Recognizer в c#. net для извлечения и удаления всей личной информации из текста - PullRequest
0 голосов
/ 04 августа 2020

Мне нужно создать экстрактор Entity в C#, который будет делать следующие вещи:

  1. читать файл (.do c, docx).
  2. сканировать do c для следующих организаций:
  3. Имя (имя, фамилия).
  4. Местоположение (включая здание, квартиру, названия улиц, штат, города и т. д. c.)
  5. Почтовый индекс.
  6. Идентификационный номер транспортного средства
  7. Социальное обеспечение.
  8. Номер телефона.
  9. Практически все лица, удостоверяющие личность.

Как только эти объекты будут найдены, удалите их и сохраните остальные данные.

Я пробовал Stanford.NER, но он распознает только человека, организацию и место (только названия городов). Я хочу, чтобы название улицы и название здания.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...