Чтение документов в .NET - PullRequest
       32

Чтение документов в .NET

1 голос
/ 04 декабря 2010

Могу ли я открыть любые форматы файлов с помощью взаимодействия Word, которые поддерживает сам Microsoft Word?

Моя задача выглядит очень простой, мне нужно читать текст, только текст, из любого типа документов, которые обычно используются (для сравнениядокументы по содержанию).Есть ли способ, которым я могу сделать это проще, чем вышеупомянутый Word Iterop?Существуют ли бесплатные библиотеки для этого?Или открыть любой (.doc, .docx, .pdf, .rtf, openoffice docs и т. Д.) Типы документов?Я занят поиском, но пока не нашел слишком много решений, и я не могу позволить себе изучить спецификации на 800 страниц для всех форматов.

PS: обработка pdf по отдельности - это нормально, также какимея библиотеки для всех типов.

Ответы [ 2 ]

2 голосов
/ 04 декабря 2010
0 голосов
/ 07 декабря 2013

Я работаю над новым фреймворком под названием Toxy.Цель этого состоит в том, чтобы извлечь данные / текст из различных документов, как то, что вы упомянули.Первый релиз будет доступен в начале следующего года.

...