Чтение образа MS Doc из Java - PullRequest
1 голос
/ 02 марта 2011

Я хочу прочитать изображение, встроенное в документ MS Word, используя Java. Я хочу восстановить файл изображения. Можете ли вы предположить, что любая java-библиотека справится с этой задачей?

1 Ответ

0 голосов
/ 02 марта 2011

Пожалуйста, обратитесь к Apache POI для обработки файлов Microsoft Word с использованием API Java

Просто фрагмент кода.Проверьте это.

import org.apache.poi.poifs.filesystem.*;
import org.apache.poi.hwpf.*;
import org.apache.poi.hwpf.extractor.*;
import java.io.*;

public class readDoc
{
    public static void main( String[] args )
    {
        String filesname = "Hello.doc";
        POIFSFileSystem fs = null;
        try
        {
       fs = new POIFSFileSystem(new FileInputStream(filesname; 
      //Couldn't close the braces at the end as my site did not allow it to close

                  HWPFDocument doc = new HWPFDocument(fs);

          WordExtractor we = new WordExtractor(doc);

          String[] paragraphs = we.getParagraphText();

          System.out.println( "Word Document has " + paragraphs.length + " paragraphs" );
          for( int i=0; i<paragraphs .length; i++ ) {
            paragraphs[i] = paragraphs[i].replaceAll("\\cM?\r?\n","");
                    System.out.println( "Length:"+paragraphs[ i ].length());
          }
                }
                catch(Exception e) { 
                    e.printStackTrace();
                }
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...