Как извлечь номер главы в файл .doc с текстом? - PullRequest
1 голос
/ 31 августа 2010

Я использую Apache POI HWPF для извлечения файла .doc, я обнаружил, что извлеченный текст не имеет номера главы , Может ли POI извлечь номер главы с текстом?

public void readDocFile() {
    File docFile = null;
    WordExtractor docExtractor = null;
    WordExtractor exprExtractor = null;
    try {
        docFile = new File("C:\\Documents and Settings\\Administrator\\Desktop\\Topo6.doc");
        // A FileInputStream obtains input bytes from a file.
        FileInputStream fis = new FileInputStream(docFile.getAbsolutePath());

        // A HWPFDocument used to read document file from FileInputStream
        HWPFDocument doc = new HWPFDocument(fis);
        docExtractor = new WordExtractor(doc);
    } catch (Exception exep) {
        System.out.println(exep.getMessage());
    }

    // This Array stores each line from the document file.
    String text = docExtractor.getText();
    System.out.println(text);


}

1 Ответ

2 голосов
/ 18 июня 2011

Хорошо, я понял.

Номер главы в файле .doc, который генерируется в офисном слове, является динамическим, поэтому я должен получить уровень каждого абзаца и рассчитать номер главы самостоятельно.

...