Код для чтения документов Word - PullRequest
1 голос
/ 02 ноября 2011

Мне нужен скрипт (или другой код, C # и т. Д.), Который будет извлекать каждый абзац / предложение, содержащее определенное слово в наборе документов Word 2007, и перемещать их в новый документ Word, записывая имя файла оригинала(источник) документ, из которого они были извлечены.

Ответы [ 3 ]

1 голос
/ 02 ноября 2011

Это может дать вам начало: http://msdn.microsoft.com/en-us/library/ff834910.aspx

1 голос
/ 02 ноября 2011

Office Interop - вариант, но будьте осторожны: он не поддерживается MS в серверных сценариях (например, ASP.NET или Windows Service или аналогичных) - см. http://support.microsoft.com/default.aspx?scid=kb;EN-US;q257757#kb2!

Вам нужно будет использовать библиотеку, чтобы достичь желаемого:

1 голос
/ 02 ноября 2011

Как насчет использования индексатора документов, такого как dtSearch , для индексации ваших документов (word, pdf и т. Д.), А затем нажмите на их API, чтобы выполнить свой уникальный поиск таким образом.Судя по тому, что это может быть самый быстрый способ сделать это.Предоставленные индексаторы, такие как dtSearch, стоят денег (не много), но иногда это может стоить затрат по сравнению с часами, которые вы потратите, пытаясь написать свой собственный код, чтобы сделать то же самое.

Некоторые статьи, которые я нашел, которые могут привести вас в правильном направлении, если вы не хотите использовать индексатор:

http://omegacoder.com/?p=555

и

http://weblogs.asp.net/guystarbuck/archive/2008/05/13/automated-search-and-replace-in-multiple-word-2007-documents-with-c.aspx

Редактировать Чтобы найти предложение, содержащее определенное слово, вы можете попробовать эту ссылку http://msdn.microsoft.com/en-us/library/bb546163.aspx

...