Мы работали с библиотекой NLTK в недавнем проекте, где мы
в основном заинтересованы в названной части сущностей.
В целом мы получаем хорошие результаты, используя класс NEChunkParser.
Тем не менее, мы пытаемся найти способ предоставить наши собственные условия
парсер, без успеха.
Например, у нас есть тестовый документ, в котором мое имя (Шей) появляется в
несколько мест. Библиотека находит меня как GPE, в то время как я бы хотел найти его
я как ЧЕЛОВЕК ...
Есть ли способ предоставить какой-то нестандартный файл /
код, так что синтаксический анализатор сможет интерпретировать именованный объект как я
хочешь этого?
Спасибо!