Хорошо, у меня есть следующий код для обучения Идентификатора NER из OpenNLP
FileReader fileReader = new FileReader("train.txt");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);
Я не знаю, делаю ли я что-то неправильно, если что-то отсутствует, но классификация не работает,Я предполагаю, что train.txt неверен.
Возникает ошибка , что все токены относятся только к одному типу.
Мои данные train.txtэто что-то вроде следующего примера, но с большим количеством вариаций и количества записей.Другое дело, что я классифицирую слово за словом по тексту за раз, а не по всем токенам.
<START:distance> 8000m <END>
<START:temperature> 100ºC <END>
<START:weight> 50kg <END>
<START:name> Renato <END>
Кто-нибудь может показать, что я делаю неправильно?