Stanford NLP - UnsupportedOperationException: длины массива аргумента отличаются - PullRequest
0 голосов
/ 10 мая 2018

Я пытаюсь следовать учебнику How can I train my own NER model здесь: https://nlp.stanford.edu/software/crf-faq.shtml#b

Когда я запускаю тестовую команду для проверки производительности модели: java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier ner-model.ser.gz -testFile jane-austen-emma-ch2.tsv

Я получаю следующую ошибку:

Invoked on Thu May 10 15:40:41 IST 2018 with arguments: -loadClassifier ner-model.ser.gz -testFile jane-austen-emma-ch2.tsv
testFile=jane-austen-emma-ch2.tsv
loadClassifier=ner-model.ser.gz
Loading classifier from ner-model.ser.gz ... done [0.2 sec].
Error on line 1: CHAPTER        O
Exception in thread "main" java.lang.UnsupportedOperationException: 
Argument array lengths differ: [class edu.stanford.nlp.ling.CoreAnnotations$TextAnnotation, class edu.stanford.nlp.ling.CoreAnnotations$AnswerAnnotation] vs. [CHAPTER, , O]
    at edu.stanford.nlp.ling.CoreLabel.initFromStrings(CoreLabel.java:263)
    at edu.stanford.nlp.ling.CoreLabel.<init>(CoreLabel.java:150)
    ...
    ...
    at edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyAndWriteAnswers(AbstractSequenceClassifier.java:1189)
   at edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyAndWriteAnswers(AbstractSequenceClassifier.java:1133)
   at edu.stanford.nlp.ie.AbstractSequenceClassifier.classifyAndWriteAnswers(AbstractSequenceClassifier.java:1087)
   at edu.stanford.nlp.ie.crf.CRFClassifier.main(CRFClassifier.java:3033)

Я использовал предоставленные учебные и тестовые файлы. Есть идеи, что здесь происходит?

1 Ответ

0 голосов
/ 11 мая 2018

Ну, проблема в том, что файл jane-austen-emma-ch2.tsv, представленный на сайте Стэнфорда, имел дополнительный символ табуляции.Как только я удалил это, это решило проблему.

...