PDF Извлечение текста - PullRequest
       13

PDF Извлечение текста

0 голосов
/ 26 апреля 2018

Я хочу выбрать путь к моему pdf файлу в

private static final int DIALOG_LOAD_FILE = 1000;

У меня есть две кнопки, одна для получения пути к файлу PDF, а другая для экстракции текста:

Button b1 = (Button) x.findViewById(R.id.buttonStripText);
        Button button = (Button) x.findViewById(R.id.pick);
        button.setOnClickListener(new View.OnClickListener()
        {
            @Override
            public void onClick(View v)
            {
                Intent intent = new Intent(Intent.ACTION_GET_CONTENT);
                intent.setType("file/*");
                startActivityForResult(intent,DIALOG_LOAD_FILE);
            }
        });
        b1.setOnClickListener(new View.OnClickListener()
        {
            @Override
            public void onClick(View v)
            {
                stripText(v);
            }
        });

А две другие функции

@Override
    public void onActivityResult(int requestCode, int resultCode, Intent data) {
        // TODO Auto-generated method stub
        switch(requestCode){
            case DIALOG_LOAD_FILE:
                if(resultCode==RESULT_OK){
                   fileName = data.getData().getPath();
                   System.out.println("Your File Name is:::"+fileName);
                }
                break;

        }
    }
    private void setup() {
        PDFBoxResourceLoader.init(getActivity().getApplicationContext());
        root = android.os.Environment.getExternalStorageDirectory();
        assetManager = getActivity().getAssets();
    }
    public void stripText(View v) {
        String parsedText = null;
        try {

            PDDocument document  = PDDocument.load(assetManager.open("cover_letter.pdf"));
            PDFTextStripper pdfStripper = new PDFTextStripper();
            pdfStripper.setStartPage(0);
            pdfStripper.setEndPage(1);
            parsedText = "Parsed text: " + pdfStripper.getText(document);
                if (document != null) document.close();
            } catch (Exception e) {
                e.printStackTrace();
            }

        tv.setText(parsedText);
    }

Я не выдаю ошибку, но также не получает извлеченный текст. Этот вид Dialog_Load_File открывает гугл-диск, если возможно, чтобы показать мне, как открыть внутреннее хранилище! Любая помощь будет оценена!

1 Ответ

0 голосов
/ 27 апреля 2018
PDDocument document = PDDocument.load(assetManager.open("cover_letter.pdf"));
PDDocument document = PDDocument.load(... from any input stream .... ); 

Итак, если вы можете открыть входной поток из ресурсов, или из файла, или из файла, или из URI, все готово.

Например, если вы получите URI в onActivityResult

InputStream is = getContentResolver().openInputStream(data.getData());
PDDocument document = PDDocument.load( is ); 
...