Интересно, есть ли какой-нибудь инструмент, который может помочь мне обнаружить имя местоимения в тексте.
Пример
Jone is Spanish. He can speak German.
Как мне пометить He на Jone?
He
Jone
Проблема, которую вы пытаетесь решить, известна как разрешение анафоры . Java-инструмент для выполнения этой задачи доступен здесь . Исходный код доступен на этом сайте. Чтобы теоретически взглянуть на то, как это работает, посмотрите эту статью Лаппина и Лисса с 1994 года.
Вы ищете инструменты для разрешения ссылок?Краткий блог о некоторых доступных инструментах.Большинство написано на Java, например ArkRef, BART, и включено в Stanford CoreNLP.
Вот еще один инструмент для анализа привязки (он же разрешение анафоры): аннотатор местоимений , который должен использоваться как часть GATE framework.