MS Word распознает заголовок / шрифт и т. Д.? - PullRequest
0 голосов
/ 19 сентября 2010

Я хочу прочитать документ MS Word и определить заголовок / полужирный шрифт / подчеркнутые слова и т. Д.?Есть ли способ решить эту проблему программно?Я хочу, чтобы предложение было на Java, PHP или Ruby, если это возможно, в противном случае, если есть метаданные, также сообщите мне.

Ответы [ 2 ]

1 голос
/ 19 сентября 2010

Это связано с этим Что такое хороший API Java для создания документов Word?

Для этого API-интерфейса в стадии разработки используется API Apache.

HWPF - это название нашего порта Формат файла Microsoft Word 97 (-2007) к чистой Java. Это также обеспечивает ограниченный поддержка только для чтения для старого Word 6 и форматы файлов Word 95.и форматы файлов Word 95.

Партнер HWPF для нового Word Формат 2007 года .docx - XWPF. Пока HWPF и XWPF предоставляют аналогичные функции, нет общего интерфейса через двое из них в это время.

http://poi.apache.org/hwpf/quick-guide.html

1 голос
/ 19 сентября 2010

У вас есть Java API, который может это сделать.Я предлагаю вам взглянуть на библиотеку Apache POI .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...