Чтение .docx в C ++ - PullRequest
       33

Чтение .docx в C ++

4 голосов
/ 21 июля 2009

Я пытаюсь создать программу, которая читает файл .docx и публикует его содержимое в блоге / форуме для личного использования. Наконец-то я понял, как использовать libcurl, чтобы сделать то, что я понял, было самой сложной частью программы. Теперь я просто должен прочитать файл .docx, но попал под затруднение. Я не могу найти документацию о том, как это сделать. Есть идеи?

Ответы [ 2 ]

7 голосов
/ 21 июля 2009

Самый простой способ - использовать Word для этого. Он имеет ограничения по лицензированию.

Вопрос SO Создание, открытие и печать файла слова из C ++ имеет несколько хороших ссылок.

Edit:

В соответствии с этими вопросами / ответами можно разархивировать файл Open XML и напрямую обработать файл XML:

Если вы используете .NET, есть еще (C #) вопросы для чтения:

1 голос
/ 22 июля 2009

Если вы хотите остаться в мире открытого исходного кода, OpenOffice 3 должен иметь возможность обрабатывать файлы .docx. Есть проект по реализации API для многих языков, я не знаю, насколько он полон или сложен.

В PHP есть скрипт , который может конвертировать из .docx в обычный текст. То есть если вам не страшно, что все документы на русском языке). Это может быть другой вариант (запуск сценария php с помощью системного вызова и анализ результатов из файла)

...