Извлечение информации о возрасте из NLP - PullRequest
0 голосов
/ 07 мая 2018

Я новичок в НЛП и пытаюсь извлечь информацию о возрасте из необработанного текста.Я погуглил и не получил никакой надежной библиотеки на любом языке для этого требования.Было бы здорово, если бы я мог помочь в этом.Я открыт для любого языка, и это не является ограничением.Это также может быть на Java, Python или любом другом языке.Любая помощь приветствуется.Заранее спасибо.Приветствия!

Обновление:

Я попытался добавить аннотаторы, упомянутые в справке Stanford, к моему анализатору java, и я столкнулся со следующим исключением:

    ERROR: cannot create CorefAnnotator!
    java.lang.RuntimeException: Error creating coreference system
    at 

 edu.stanford.nlp.scoref.StatisticalCorefSystem.fromProps(StatisticalCorefSystem.java:58)
    at edu.stanford.nlp.pipeline.CorefAnnotator.<init>(CorefAnnotator.java:66)
    at edu.stanford.nlp.pipeline.AnnotatorImplementations.coref(AnnotatorImplementations.java:220)
    at edu.stanford.nlp.pipeline.AnnotatorFactories$13.create(AnnotatorFactories.java:515)
    at edu.stanford.nlp.pipeline.AnnotatorPool.get(AnnotatorPool.java:85)
    at edu.stanford.nlp.pipeline.StanfordCoreNLP.construct(StanfordCoreNLP.java:375)
    at edu.stanford.nlp.pipeline.StanfordCoreNLP.<init>(StanfordCoreNLP.java:139)
    at edu.stanford.nlp.pipeline.StanfordCoreNLP.<init>(StanfordCoreNLP.java:135)
    at com.dateparser.SUtime.SUAgeParser.makeNumericPipeline(SUAgeParser.java:85)
    at com.dateparser.SUtime.SUAgeParser.<clinit>(SUAgeParser.java:60)
Caused by: java.lang.RuntimeException: Error initializing coref system
    at edu.stanford.nlp.scoref.StatisticalCorefSystem.<init>(StatisticalCorefSystem.java:36)
    at edu.stanford.nlp.scoref.ClusteringCorefSystem.<init>(ClusteringCorefSystem.java:24)
    at edu.stanford.nlp.scoref.StatisticalCorefSystem.fromProps(StatisticalCorefSystem.java:48)
    ... 9 more
Caused by: java.io.IOException: Unable to open "edu/stanford/nlp/models/hcoref/md-model.ser" as class path, filename or URL
    at edu.stanford.nlp.io.IOUtils.getInputStreamFromURLOrClasspathOrFileSystem(IOUtils.java:485)
    at edu.stanford.nlp.io.IOUtils.readObjectFromURLOrClasspathOrFileSystem(IOUtils.java:323)
    at edu.stanford.nlp.hcoref.md.DependencyCorefMentionFinder.<init>(DependencyCorefMentionFinder.java:38)
    at edu.stanford.nlp.hcoref.CorefDocMaker.getMentionFinder(CorefDocMaker.java:149)
    at edu.stanford.nlp.hcoref.CorefDocMaker.<init>(CorefDocMaker.java:61)
    at edu.stanford.nlp.scoref.StatisticalCorefSystem.<init>(StatisticalCorefSystem.java:34)
    ... 11 more

Я обновился доверсия 1.6.0, а также добавлен stanford-corenlp-models-current.jar в путь к классам.Пожалуйста, дайте мне знать, если я что-то упустил

Обновление 1:

Исключение было исправлено после обновления до 3.9.1.Но я получаю вывод в соответствии с: продолжительностью отношения вместо per: age

private static AnnotationPipeline makePipeline() {

    Properties props = new Properties();
    props.setProperty("annotators",
             "tokenize,ssplit,pos,lemma,ner,depparse,coref,kbp");
    StanfordCoreNLP pipeline = new StanfordCoreNLP(props);
    return pipeline;


}

public static void parse(String str) {
    try {
        Annotation doc = new Annotation(str);
        pipeline.annotate(doc);
        ArrayList<CoreMap> resultRelations = new ArrayList<CoreMap>();
        List<CoreMap> mentionsAnnotations = doc.get(MentionsAnnotation.class);
        for (CoreMap currentCoreMap : mentionsAnnotations) {
            System.out.println(currentCoreMap.get(TextAnnotation.class));
            System.out.println(currentCoreMap.get(CharacterOffsetBeginAnnotation.class));
            System.out.println(currentCoreMap.get(CharacterOffsetEndAnnotation.class));
            System.out.println(currentCoreMap.get(NamedEntityTagAnnotation.class));
        }
    } catch (Exception e) {

    }
}

Это нормальное поведение или я делаю что-то не так?

1 Ответ

0 голосов
/ 08 мая 2018

Может оказаться полезным экстрактор отношений KBP.

Пример текста:

Joe Smith is 58 years old.

Команда:

java -Xmx12g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,depparse,coref,kbp -file example.txt -outputFormat text

Это должно прикрепить Joe Smith к 58 years old с отношением per:age.

...