Генерация EntityMentions из RegexNER - PullRequest
0 голосов
/ 25 сентября 2019

Я загрузил свои пользовательские теги в конвейер, но не могу получить объекты с новыми тегами.вот мой код:

Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma, ner, regexner");
String rules = Test.class.getResource("/rules.txt").getPath();
props.put("regexner.mapping", rules);
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
CoreDocument document = new CoreDocument(text);
pipeline.annotate(document);
List<CoreEntityMention> entityMentions = document.entityMentions();
for(CoreEntityMention em: entityMentions){
    System.out.printf("Entity: %s - Type: %s\n", em.text(), em.entityType());
}

однако, когда я повторяю токен и вижу теги, полученные каждым токеном, я вижу, что регулярное выражение работает, но большинство, если не все мои пользовательские теги, имеют 2 или болееслова.Что я хочу, так это когда я звоню document.entityMentions() Я получаю все, теги по умолчанию и пользовательские теги.

Мне нужна помощь, пожалуйста!

...