Stanford NLP (моделирование NER) - java.lang.UnsupportedOperationException: длины массива аргумента отличаются - PullRequest
0 голосов
/ 25 сентября 2018

Я искал и пытался поработать над этой проблемой довольно долго (около 4 дней), прежде чем приехать сюда.Я пытаюсь тренировать шведский NER-тегированный корпус.Я получил тестовые данные и данные поезда от здесь .

Вот ошибка, которую я получаю, когда пытаюсь обучить модель

\project\stanford_ner>java -mx1000m -cp stanford-ner.jar;lib/* edu.stanford.nlp.ie.crf.CRFClassifier -prop train/train_properties.txt Invoked on Tue Sep 25 10:44:13 IST 2018 with arguments: -prop train/train_properties.txt usePrevSequences=true useClassFeature=true useTypeSeqs2=true useSequences=true wordShape=chris2useLC useTypeySequences=true useDisjunctive=true noMidNGrams=true serializeTo=dummy_ner_model_swede.ser.gz maxNGramLeng=6 useNGrams=true usePrev=true useNext=true maxLeft=1 trainFile=train/dummy_swede_corpus.tsv map=word=0,answer=1 useWord=true useTypeSeqs=true Error on line 85124: bn Exception in thread "main" java.lang.UnsupportedOperationException: Argument array lengths differ: [class edu.stanford.nlp.ling.CoreAnnotations$TextAnnotation, class edu.stanford.nlp.ling.CoreAnnotations$AnswerAnnotation] vs. [bn] at edu.stanford.nlp.ling.CoreLabel.initFromStrings(CoreLabel.java:263) at edu.stanford.nlp.ling.CoreLabel.(CoreLabel.java:150)

Я пытаюсь указать на ошибку:

: Error on line 85124: bn

Exception in thread "main" java.lang.UnsupportedOperationException: Argument array lengths differ: [class edu.stanford.nlp.ling.CoreAnnotations$TextAnnotation, class edu.stanford.nlp.ling.CoreAnnotations$AnswerAnnotation] vs. [bn]

Я не понимаю, что здесь означает «bn».Я прошел через реализацию кода из github , но безрезультатно.Если я буду использовать все данные о поездах до этой строки ошибки, я смогу обучить данные и получить модель.

И на линии ошибки я не вижу ничего особенного.Это просто другое слово с тегом NER, как указано в списке свойств файла свойств.

...