Как читать содержимое из файлов MS Word, используя Джакартскую POI - PullRequest
1 голос
/ 14 февраля 2011

Я включил файл jakarta-poi-1.5.1-final-20020615.jar для чтения содержимого из MS Word.

Я не могу сделать это ... кто-нибудь может мне помочь?

Ответы [ 4 ]

2 голосов
/ 20 мая 2011

Вам нужно перейти на более новую версию POI - той, на которой вы находитесь, около 9 лет! Возьмите последнюю версию POI (сейчас это просто Apache POI, а не Apache Jakarta POI уже несколько лет), вам понадобится либо 3.7 Final, либо 3.8 beta 2 на момент написания.

Затем прочитайте HWPF документы , и вам будет хорошо.

2 голосов
/ 14 февраля 2011
0 голосов
/ 20 июня 2017

Этот метод напечатает внутренние прогоны всего документа, чтобы вы могли сравнивать значения на основе текста XML.

for (XWPFParagraph p : doc.getParagraphs()) {
    for (XWPFRun r : p.getRuns()) {
       String text = r.getText(0);
       System.out.println(text);
     }
}
0 голосов
/ 24 июня 2016

Используйте этот код с apache-poi

XWPFDocument doc = new XWPFDocument(new FileInputStream(fileName));
    List<XWPFTable> table = doc.getTables();
    for (XWPFTable xwpfTable : table) {
        List<XWPFTableRow> row = xwpfTable.getRows();
        for (XWPFTableRow xwpfTableRow : row) {
            List<XWPFTableCell> cell = xwpfTableRow.getTableCells();
            for (XWPFTableCell xwpfTableCell : cell) {
                if (xwpfTableCell != null) {
                    System.out.println(xwpfTableCell.getText());
                    String s = xwpfTableCell.getText();
                    for (XWPFParagraph p : xwpfTableCell.getParagraphs()) {
                        for (XWPFRun run : p.getRuns()) {
                            for (XWPFPicture pic : run.getEmbeddedPictures()) {
                                byte[] pictureData = pic.getPictureData().getData();
                                System.out.println("picture : " + pictureData);
                            }
                        }
                    }
                }
            }
        }
    }
...