Могу ли я использовать Win32 COM для замены текста в текстовом документе? - PullRequest
4 голосов
/ 25 июня 2009

Я должен выполнить большое количество замен в некоторых документах, и дело в том, что я хотел бы иметь возможность автоматизировать эту задачу. Некоторые документы содержат общие строки, и это было бы очень полезно, если бы это можно было автоматизировать. Из того, что я прочитал, COM может быть одним из способов сделать это, но я не знаю, поддерживается ли замена текста. Я хотел бы быть в состоянии выполнить эту задачу в Python? Является ли это возможным? Не могли бы вы опубликовать фрагмент кода, показывающий, как получить доступ к тексту документа?

Спасибо!

Ответы [ 5 ]

10 голосов
/ 25 июня 2009

Мне нравятся ответы до сих пор;
Вот проверенный пример (слегка измененный с здесь )
который заменяет все вхождения строки в документе Word:

import win32com.client

def search_replace_all(word_file, find_str, replace_str):
    ''' replace all occurrences of `find_str` w/ `replace_str` in `word_file` '''
    wdFindContinue = 1
    wdReplaceAll = 2

    # Dispatch() attempts to do a GetObject() before creating a new one.
    # DispatchEx() just creates a new one. 
    app = win32com.client.DispatchEx("Word.Application")
    app.Visible = 0
    app.DisplayAlerts = 0
    app.Documents.Open(word_file)

    # expression.Execute(FindText, MatchCase, MatchWholeWord,
    #   MatchWildcards, MatchSoundsLike, MatchAllWordForms, Forward, 
    #   Wrap, Format, ReplaceWith, Replace)
    app.Selection.Find.Execute(find_str, False, False, False, False, False, \
        True, wdFindContinue, False, replace_str, wdReplaceAll)
    app.ActiveDocument.Close(SaveChanges=True)
    app.Quit()

f = 'c:/path/to/my/word.doc'
search_replace_all(f, 'string_to_be_replaced', 'replacement_str')
8 голосов
/ 25 июня 2009

Посмотрите, если , это дает вам начало автоматизации слова с использованием python.

Как только вы откроете документ, вы можете сделать следующее.
После следующего кода вы можете закрыть документ и открыть другой.

Selection.Find.ClearFormatting
Selection.Find.Replacement.ClearFormatting
With Selection.Find
    .Text = "test"
    .Replacement.Text = "test2"
    .Forward = True
    .Wrap = wdFindContinue
    .Format = False
    .MatchCase = False
    .MatchWholeWord = False
    .MatchKashida = False
    .MatchDiacritics = False
    .MatchAlefHamza = False
    .MatchControl = False
    .MatchWildcards = False
    .MatchSoundsLike = False
    .MatchAllWordForms = False
End With
Selection.Find.Execute Replace:=wdReplaceAll

Приведенный выше код заменяет текст «test» на «test2» и выполняет «замену всех».
Вы можете включить / выключить другие параметры в зависимости от того, что вам нужно.

Простой способ узнать это - создать макрос с действиями, которые вы хотите выполнить, посмотреть сгенерированный код и использовать его в своем собственном примере (с / без измененных параметров).

РЕДАКТИРОВАТЬ: После просмотра кода Мэтью, вы могли бы сделать следующее

MSWord.Documents.Open(filename)
Selection = MSWord.Selection

А затем перевести приведенный выше код VB на Python.
Примечание. Следующий код VB - это сокращенный способ назначения свойства без использования длинного синтаксиса.

(VB)

With Selection.Find
    .Text = "test"
    .Replacement.Text = "test2"
End With

Python

find = Selection.Find
find.Text = "test"
find.Replacement.Text = "test2"

Простите за знание Python. Но я надеюсь, что у вас есть идея двигаться вперед.
Не забудьте выполнить операцию сохранения и закрытия документа после выполнения операции поиска / замены.

В конце концов, вы можете вызвать MSWord.Quit (чтобы освободить объект Word из памяти).

3 голосов
/ 25 июня 2009

Если это сообщение в списке рассылки верно, доступ к тексту документа прост как:

MSWord = win32com.client.Dispatch("Word.Application")
MSWord.Visible = 0 
MSWord.Documents.Open(filename)
docText = MSWord.Documents[0].Content

Также см. Как: искать и заменять текст в документах . В примерах используются VB и C #, но основы должны применяться и к Python.

2 голосов
/ 30 июня 2009

Вы также можете добиться этого, используя VBScript . Просто введите код в файл с именем script.vbs, затем откройте командную строку (Пуск -> Выполнить -> Cmd), затем перейдите в папку, в которой находится скрипт, и введите:

cscript script.vbs 

strFolder = "C:\Files"

Const wdFormatDocument  = 0

'Select all files in strFolder
strComputer = "."
Set objWMIService = GetObject("winmgmts:\\" & strComputer & "\root\cimv2")
Set colFiles = objWMIService.ExecQuery _
    ("ASSOCIATORS OF {Win32_Directory.Name='" & strFolder & "'} Where " _
        & "ResultClass = CIM_DataFile")

'Start MS Word
Set objWord = CreateObject("Word.Application")

Const wdReplaceAll = 2
Const wdOrientLandscape = 1


For Each objFile in colFiles
    If objFile.Extension = "doc" Then
        strFile = strFolder & "\" & objFile.FileName & "." & objFile.Extension
        strNewFile = strFolder & "\" & objFile.FileName & ".doc"
        Wscript.Echo "Processing " & objFile.Name & "..."

        Set objDoc = objWord.Documents.Open(strFile)

        objDoc.PageSetup.Orientation = wdOrientLandscape

        'Replace text - ^p in a string stands for new paragraph; ^m stands for page break
        Set objSelection = objWord.Selection
        objSelection.Find.Text = "String to replace"
        objSelection.Find.Forward = TRUE
        objSelection.Find.Replacement.Text = "New string"

        objSelection.Find.Execute ,,,,,,,,,,wdReplaceAll

        objDoc.SaveAs strNewFile, wdFormatDocument
        objDoc.Close
        Wscript.Echo "Ready"
    End If
Next

objWord.Quit

2 голосов
/ 25 июня 2009

Оформить заказ по ссылке: http://python.net/crew/pirx/spam7/

Ссылки слева указывают на документацию.

Вы можете обобщить это, используя объектную модель, которая находится здесь:

http://msdn.microsoft.com/en-us/library/kw65a0we(VS.80).aspx

...