OpenNLP в Android получает исключение FileNotFoundException при попытке инициализации posModel - PullRequest
0 голосов
/ 29 апреля 2020

Я использую open nlp в моем проекте. Я хотел бы использовать словарный лемматизатор, но я не могу правильно ввести posModel, у меня есть класс summaryActivity, который вызывает эту функцию по нажатию кнопки

private String summaryTool(String documentText) throws Exception {
        InputStream sentInput = getAssets().open("en_sent.bin");
        InputStream tokenInput = getAssets().open("en_token.bin");
        InputStream lemmaInput = getAssets().open("en_lemmatizer.dict");
        FileInputStream posInput = getApplicationContext().openFileInput("en_pos_maxent.bin");

        preProcessor = new PreProcessor(sentInput, tokenInput, lemmaInput, posInput);
        grapher = new Grapher();

        sentInput.close();
        tokenInput.close();
        lemmaInput.close();
        posInput.close();

И мой конструктор класса препроцессора, где posModel инициализируется

 public PreProcessor(InputStream sentenceModel, InputStream tokenizerModel, InputStream lemmaModel, InputStream pos) throws IOException {
        SentenceModel sentModel = new SentenceModel(sentenceModel);
        sentenceDetector = new SentenceDetectorME(sentModel);
        TokenizerModel tokenModel = new TokenizerModel(tokenizerModel);
        tokenizer = new TokenizerME(tokenModel);
//line with exception
        POSModel posModel = new POSModel(pos);
        posTagger = new POSTaggerME(posModel);
        lemmatizer = new DictionaryLemmatizer(lemmaModel);
    }

Вот так выглядит моя папка sr c: Я поместил файл en_pos_maxent.bin в несколько мест при попытке загрузить его

Я пытался использовать getAssets().open("en_pos_maxent.bin");, но получаю неправильное исключение формата входного потока

W/System.err: opennlp.tools.util.InvalidFormatException: The profile data stream has an invalid format!
        at opennlp.tools.dictionary.serializer.DictionaryEntryPersistor.create(DictionaryEntryPersistor.java:224)
        at opennlp.tools.postag.POSDictionary.create(POSDictionary.java:228)
        at opennlp.tools.postag.POSTaggerFactory$POSDictionarySerializer.create(POSTaggerFactory.java:296)
        at opennlp.tools.postag.POSTaggerFactory$POSDictionarySerializer.create(POSTaggerFactory.java:293)
        at opennlp.tools.util.model.BaseModel.finishLoadingArtifacts(BaseModel.java:312)
        at opennlp.tools.util.model.BaseModel.loadModel(BaseModel.java:242)
        at opennlp.tools.util.model.BaseModel.<init>(BaseModel.java:176)
        at opennlp.tools.postag.POSModel.<init>(POSModel.java:97)
        at com.mtah.tools.PreProcessor.<init>(PreProcessor.java:46)
        at com.mtah.summerizer.SummaryActivity.summaryTool(SummaryActivity.java:57)
        at com.mtah.summerizer.SummaryActivity.onCreate(SummaryActivity.java:36)
        at android.app.Activity.performCreate(Activity.java:7820)
        at android.app.Activity.performCreate(Activity.java:7809)
        at android.app.Instrumentation.callActivityOnCreate(Instrumentation.java:1318)
        at android.app.ActivityThread.performLaunchActivity(ActivityThread.java:3362)
        at android.app.ActivityThread.handleLaunchActivity(ActivityThread.java:3526)
        at android.app.servertransaction.LaunchActivityItem.execute(LaunchActivityItem.java:83)
        at android.app.servertransaction.TransactionExecutor.executeCallbacks(TransactionExecutor.java:135)
        at android.app.servertransaction.TransactionExecutor.execute(TransactionExecutor.java:95)
        at android.app.ActivityThread$H.handleMessage(ActivityThread.java:2122)
        at android.os.Handler.dispatchMessage(Handler.java:107)
        at android.os.Looper.loop(Looper.java:214)
        at android.app.ActivityThread.main(ActivityThread.java:7695)
W/System.err:     at java.lang.reflect.Method.invoke(Native Method)
        at com.android.internal.os.RuntimeInit$MethodAndArgsCaller.run(RuntimeInit.java:516)
        at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:950)
    Caused by: org.xml.sax.SAXException: Can't create default XMLReader; is system property org.xml.sax.driver set?
        at org.xml.sax.helpers.XMLReaderFactory.createXMLReader(XMLReaderFactory.java:160)
        at opennlp.tools.dictionary.serializer.DictionaryEntryPersistor.create(DictionaryEntryPersistor.java:219)
        ... 25 more

I. Я также попробовал Soultion из этого поста , но я получил исключение java.lang.NullPointerException: Attempt to invoke virtual method 'java.lang.String java.util.Properties.getProperty(java.lang.String)' on a null object reference

Мой вопрос: как мне открыть файл "en_pos_maxent.bin" с FileInputStream правильно? кажется, что opennlps POSModel принимает только InputStream типа FileInputStream. Извините, если я пропустил какую-либо информацию, я не публикую часто, пожалуйста, дайте мне знать, и я включу ее. Любая помощь будет оценена.

1 Ответ

0 голосов
/ 01 мая 2020

Этот ответ из этот пост работал для меня.

System.setProperty("org.xml.sax.driver", "org.xmlpull.v1.sax2.Driver");
    try {
        AssetFileDescriptor fileDescriptor = 
            getApplicationContext.getAssets().openFd("en_pos_maxent.bin");
        FileInputStream inputStream = fileDescriptor.createInputStream();
        POSModel posModel = new POSModel(inputStream);
        posTaggerME = new POSTaggerME(posModel);
    } catch (Exception e) {
        //Handle exception
    }
...