У меня очень простой способ извлечь имена, организации и местоположения из строки.Я использую библиотеки .NET Nuget для Stanford NLP.Похоже на это.
CRFClassifier Classifier = CRFClassifier.getClassifier(StanfordNLPConfig.NER.ClassifierModel);
List<IndexViewModel> ivms = new List<IndexViewModel>();
try
{
foreach (List sentence in Classifier.classify(content).toArray())
{
NLPTranslator translator = new NLPTranslator();
ivms.AddRange(translator.NERTranslate(sentence));
}
}
catch (Exception ex)
{
throw ex;
// Error silently
}
return ivms;
Модель представляет собой файл jar 3class, с которым она поставляется - english.all.3class.distsim.crf.ser.gz.
Это работает очень хорошо для меня, но будетЯ хотел бы сделать это для взаимодействия с моделью, чтобы иметь возможность добавлять свои собственные объекты, если мне это необходимо, это кажется очень ориентированным на Америку, и я хотел бы иметь возможность размещать свои собственные британские компании, местоположения и т. Д.
Можно ли как-то добавить эти объекты, как я читал об обучении, но вы, возможно, не сможете расширить модель, если это так, могу ли я объединить классификаторы и провести их через британскую модель?/ США один и т. Д. Если это возможно, как я могу на самом деле сделать свой собственный классификатор, как я хотел бы сделать это в .NET, если это возможно.