Результат IronOCR в файл MS-Word с форматированием текста - PullRequest
0 голосов
/ 22 апреля 2020

Я успешно запустил IronOCR в VB.net 2019, а также получил хорошие результаты, используя следующий код.

 Imports System.IO
    Imports IronOcr
    Imports Microsoft.Office.Interop

Dim Ocr = New IronOcr.AdvancedOcr() With {
          .CleanBackgroundNoise = True,
          .EnhanceContrast = True,
          .EnhanceResolution = True,
          .Language = IronOcr.Languages.English.OcrLanguagePack,
          .Strategy = IronOcr.AdvancedOcr.OcrStrategy.Advanced,
          .ColorSpace = IronOcr.AdvancedOcr.OcrColorSpace.Color,
          .DetectWhiteTextOnDarkBackgrounds = True,
          .InputImageType = IronOcr.AdvancedOcr.InputTypes.AutoDetect,
          .RotateAndStraighten = True,
          .ReadBarCodes = True,
          .ColorDepth = 4
      }

         Private Sub Form1_Load(sender As Object, e As EventArgs) Handles MyBase.Load
            Dim Result = Ocr.Read("D:\ImageFileforOCR.png")
            oWord = OpenAWordFile()
            oDoc = oWord.Documents.Add()
            DocfileSetup(oDoc)
            oWord.Selection.(Text:=txtOCR)
End Sub

Однако сохраненный результат не отформатирован в соответствии с документом изображения. Стили шрифта, размер шрифта, полужирный / обычный шрифт, подчеркивание, выравнивание абзацев, нумерация абзацев и т. Д. c теряются в файле MS-Word.

Может кто-нибудь подсказать, как сохранить Page Setup и text format при сохранении результатов в файл MS-Word.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...