Я пытаюсь использовать тегирование NER в Stanford CoreNLP.Я хочу разделить фразы так, чтобы «Джон Смит» не возвращался (Джон: Персона), (Смит: Персона), а вместо тегов (Джон Смит: Персона).Я нашел следующую документацию:
https://nlp.stanford.edu/nlp/javadoc/javanlp-3.5.0/edu/stanford/nlp/pipeline/ChunkAnnotationUtils.html
, но кажется, что вам нужно добавить индекс токена, чтобы вы могли вручную указать, где должен начинаться и заканчиваться блок, а не обнаруживать его автоматически,Кроме того, я не могу найти примеры этого использования.