В каком формате Word ваши документы? Если они находятся в Open XML (расширение файла .docx), вы можете использовать Open XML SDK , доступный от Microsoft, для извлечения изображений и встроенного содержимого.
Файл Open XML - это не что иное, как zip-архив, использующий специальную структуру. В SDK вы найдете примеры доступа к частям этого zip-архива. На самом деле вы можете использовать любую zip-совместимую библиотеку для извлечения содержимого из пакета документов.
Если в документах все еще используется старый двоичный формат, все немного сложнее. Я думаю, что самым простым способом было бы преобразовать документы в формат Open XML. Есть несколько способов сделать это:
- Получите бесплатный и открытый b2xtranslator от SourceForge, который предлагает вам C # dll для преобразования файлов.
Установите пакет обеспечения совместимости от Microsoft и используйте для преобразования следующую командную строку:
"C:\Program Files\Microsoft Office\Office12\wordconv.exe" -oice -nme input\_file output_file
где input_file и output_file должны быть полными путями.