Читать документ Word в C # - PullRequest
       8

Читать документ Word в C #

2 голосов
/ 27 февраля 2011

Я хочу прочитать документ Word на сервере (как doc, так и docx). Сервер не имеет офис установлен, поэтому я не могу использовать com-объекты, а также нет коммерческих программ.

Есть ли способ, которым я могу использовать только офисные инструменты и читать слово docs (2003 и 2007)

Ответы [ 2 ]

4 голосов
/ 27 февраля 2011

К сожалению, хороших бесплатных опций для чтения файлов .doc и .docx нет. Даже коммерческие варианты редки по разумным ценам, но есть хорошие и чрезвычайно дорогие варианты.

Для чтения файлов .doc единственная бесплатная опция, о которой я знаю, это POI для Java, которую вы можете запустить в .NET с помощью IKVM. Однако Word поддерживает экспериментальную ветку SVN-репозитория POI, поэтому я не знаю, насколько хорошо она работает.

http://poi.apache.org/

http://www.ikvm.net/

Если вы просто хотите получить текст из файла .doc и не заботитесь о форматировании, вы можете использовать интерфейс IFilter Win32 через pinvoke.

Для чтения файлов .docx вы можете использовать Microsoft Office Open XML SDK. Не позволяйте "SDK" обмануть вас, хотя это очень легкая абстракция по отношению к работе с XML напрямую. Его почти так же больно.

http://www.microsoft.com/downloads/en/details.aspx?FamilyId=C6E744E5-36E9-45F5-8D8C-331DF206E0D0&displaylang=en

1 голос
/ 07 июня 2011

Для .docx ваш бесплатный вариант DocX . Очень продвинутый и простой в использовании. Для доку я не видел бесплатной альтернативы.

...