Мне нужно создать экстрактор Entity в C#, который будет делать следующие вещи:
- читать файл (.do c, docx).
- сканировать do c для следующих организаций:
- Имя (имя, фамилия).
- Местоположение (включая здание, квартиру, названия улиц, штат, города и т. д. c.)
- Почтовый индекс.
- Идентификационный номер транспортного средства
- Социальное обеспечение.
- Номер телефона.
- Практически все лица, удостоверяющие личность.
Как только эти объекты будут найдены, удалите их и сохраните остальные данные.
Я пробовал Stanford.NER, но он распознает только человека, организацию и место (только названия городов). Я хочу, чтобы название улицы и название здания.