Предполагая, что вы хотите извлечь текстовое содержимое файла doc, есть несколько инструментов командной строки, а также коммерческие библиотеки. Довольно старый инструмент, который мы когда-то использовали для поиска файлов doc (не docx) (в сочетании с sphider поисковой системы), был catdoc (также здесь ), который является DOS, а не Инструмент Windows, но тем не менее работал для нас, пока мы выполняли предварительные условия (формат имени файла 8.3).
Коммерческий продукт doc2txt , если вы можете позволить себе $ 29.
Для более нового формата docx вы можете использовать инструмент на основе Perl docx2txt .
Конечно, если вы хотите запустить эти инструменты из c #, вам нужно запустить внешний процесс - проверьте здесь для подробного объяснения.
Довольно дорогой, но очень мощный инструмент для доступа к документам и документам DOCX: Spire.doc , но он делает намного больше, чем нужно. Его удобнее использовать, поскольку это библиотека .NET.