Я искал и пытался поработать над этой проблемой довольно долго (около 4 дней), прежде чем приехать сюда.Я пытаюсь тренировать шведский NER-тегированный корпус.Я получил тестовые данные и данные поезда от здесь .
Вот ошибка, которую я получаю, когда пытаюсь обучить модель
\project\stanford_ner>java -mx1000m -cp stanford-ner.jar;lib/*
edu.stanford.nlp.ie.crf.CRFClassifier -prop train/train_properties.txt
Invoked on Tue Sep 25 10:44:13 IST 2018 with arguments: -prop
train/train_properties.txt
usePrevSequences=true
useClassFeature=true
useTypeSeqs2=true
useSequences=true
wordShape=chris2useLC
useTypeySequences=true
useDisjunctive=true
noMidNGrams=true
serializeTo=dummy_ner_model_swede.ser.gz
maxNGramLeng=6
useNGrams=true
usePrev=true
useNext=true
maxLeft=1
trainFile=train/dummy_swede_corpus.tsv
map=word=0,answer=1
useWord=true
useTypeSeqs=true
Error on line 85124: bn
Exception in thread "main" java.lang.UnsupportedOperationException: Argument
array lengths differ: [class
edu.stanford.nlp.ling.CoreAnnotations$TextAnnotation, class
edu.stanford.nlp.ling.CoreAnnotations$AnswerAnnotation] vs. [bn]
at edu.stanford.nlp.ling.CoreLabel.initFromStrings(CoreLabel.java:263)
at edu.stanford.nlp.ling.CoreLabel.(CoreLabel.java:150)
Я пытаюсь указать на ошибку:
:
Error on line 85124: bn
Exception in thread "main" java.lang.UnsupportedOperationException: Argument array lengths differ: [class
edu.stanford.nlp.ling.CoreAnnotations$TextAnnotation, class
edu.stanford.nlp.ling.CoreAnnotations$AnswerAnnotation] vs. [bn]
Я не понимаю, что здесь означает «bn».Я прошел через реализацию кода из github , но безрезультатно.Если я буду использовать все данные о поездах до этой строки ошибки, я смогу обучить данные и получить модель.
И на линии ошибки я не вижу ничего особенного.Это просто другое слово с тегом NER, как указано в списке свойств файла свойств.