Я загрузил свои пользовательские теги в конвейер, но не могу получить объекты с новыми тегами.вот мой код:
Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma, ner, regexner");
String rules = Test.class.getResource("/rules.txt").getPath();
props.put("regexner.mapping", rules);
StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
CoreDocument document = new CoreDocument(text);
pipeline.annotate(document);
List<CoreEntityMention> entityMentions = document.entityMentions();
for(CoreEntityMention em: entityMentions){
System.out.printf("Entity: %s - Type: %s\n", em.text(), em.entityType());
}
однако, когда я повторяю токен и вижу теги, полученные каждым токеном, я вижу, что регулярное выражение работает, но большинство, если не все мои пользовательские теги, имеют 2 или болееслова.Что я хочу, так это когда я звоню document.entityMentions()
Я получаю все, теги по умолчанию и пользовательские теги.
Мне нужна помощь, пожалуйста!