Я использую open nlp в моем проекте. Я хотел бы использовать словарный лемматизатор, но я не могу правильно ввести posModel, у меня есть класс summaryActivity, который вызывает эту функцию по нажатию кнопки
private String summaryTool(String documentText) throws Exception {
InputStream sentInput = getAssets().open("en_sent.bin");
InputStream tokenInput = getAssets().open("en_token.bin");
InputStream lemmaInput = getAssets().open("en_lemmatizer.dict");
FileInputStream posInput = getApplicationContext().openFileInput("en_pos_maxent.bin");
preProcessor = new PreProcessor(sentInput, tokenInput, lemmaInput, posInput);
grapher = new Grapher();
sentInput.close();
tokenInput.close();
lemmaInput.close();
posInput.close();
И мой конструктор класса препроцессора, где posModel инициализируется
public PreProcessor(InputStream sentenceModel, InputStream tokenizerModel, InputStream lemmaModel, InputStream pos) throws IOException {
SentenceModel sentModel = new SentenceModel(sentenceModel);
sentenceDetector = new SentenceDetectorME(sentModel);
TokenizerModel tokenModel = new TokenizerModel(tokenizerModel);
tokenizer = new TokenizerME(tokenModel);
//line with exception
POSModel posModel = new POSModel(pos);
posTagger = new POSTaggerME(posModel);
lemmatizer = new DictionaryLemmatizer(lemmaModel);
}
Вот так выглядит моя папка sr c: Я поместил файл en_pos_maxent.bin в несколько мест при попытке загрузить его
Я пытался использовать getAssets().open("en_pos_maxent.bin");
, но получаю неправильное исключение формата входного потока
W/System.err: opennlp.tools.util.InvalidFormatException: The profile data stream has an invalid format!
at opennlp.tools.dictionary.serializer.DictionaryEntryPersistor.create(DictionaryEntryPersistor.java:224)
at opennlp.tools.postag.POSDictionary.create(POSDictionary.java:228)
at opennlp.tools.postag.POSTaggerFactory$POSDictionarySerializer.create(POSTaggerFactory.java:296)
at opennlp.tools.postag.POSTaggerFactory$POSDictionarySerializer.create(POSTaggerFactory.java:293)
at opennlp.tools.util.model.BaseModel.finishLoadingArtifacts(BaseModel.java:312)
at opennlp.tools.util.model.BaseModel.loadModel(BaseModel.java:242)
at opennlp.tools.util.model.BaseModel.<init>(BaseModel.java:176)
at opennlp.tools.postag.POSModel.<init>(POSModel.java:97)
at com.mtah.tools.PreProcessor.<init>(PreProcessor.java:46)
at com.mtah.summerizer.SummaryActivity.summaryTool(SummaryActivity.java:57)
at com.mtah.summerizer.SummaryActivity.onCreate(SummaryActivity.java:36)
at android.app.Activity.performCreate(Activity.java:7820)
at android.app.Activity.performCreate(Activity.java:7809)
at android.app.Instrumentation.callActivityOnCreate(Instrumentation.java:1318)
at android.app.ActivityThread.performLaunchActivity(ActivityThread.java:3362)
at android.app.ActivityThread.handleLaunchActivity(ActivityThread.java:3526)
at android.app.servertransaction.LaunchActivityItem.execute(LaunchActivityItem.java:83)
at android.app.servertransaction.TransactionExecutor.executeCallbacks(TransactionExecutor.java:135)
at android.app.servertransaction.TransactionExecutor.execute(TransactionExecutor.java:95)
at android.app.ActivityThread$H.handleMessage(ActivityThread.java:2122)
at android.os.Handler.dispatchMessage(Handler.java:107)
at android.os.Looper.loop(Looper.java:214)
at android.app.ActivityThread.main(ActivityThread.java:7695)
W/System.err: at java.lang.reflect.Method.invoke(Native Method)
at com.android.internal.os.RuntimeInit$MethodAndArgsCaller.run(RuntimeInit.java:516)
at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:950)
Caused by: org.xml.sax.SAXException: Can't create default XMLReader; is system property org.xml.sax.driver set?
at org.xml.sax.helpers.XMLReaderFactory.createXMLReader(XMLReaderFactory.java:160)
at opennlp.tools.dictionary.serializer.DictionaryEntryPersistor.create(DictionaryEntryPersistor.java:219)
... 25 more
I. Я также попробовал Soultion из этого поста , но я получил исключение java.lang.NullPointerException: Attempt to invoke virtual method 'java.lang.String java.util.Properties.getProperty(java.lang.String)' on a null object reference
Мой вопрос: как мне открыть файл "en_pos_maxent.bin" с FileInputStream
правильно? кажется, что opennlps POSModel
принимает только InputStream
типа FileInputStream
. Извините, если я пропустил какую-либо информацию, я не публикую часто, пожалуйста, дайте мне знать, и я включу ее. Любая помощь будет оценена.