Я успешно запустил IronOCR
в VB.net 2019
, а также получил хорошие результаты, используя следующий код.
Imports System.IO
Imports IronOcr
Imports Microsoft.Office.Interop
Dim Ocr = New IronOcr.AdvancedOcr() With {
.CleanBackgroundNoise = True,
.EnhanceContrast = True,
.EnhanceResolution = True,
.Language = IronOcr.Languages.English.OcrLanguagePack,
.Strategy = IronOcr.AdvancedOcr.OcrStrategy.Advanced,
.ColorSpace = IronOcr.AdvancedOcr.OcrColorSpace.Color,
.DetectWhiteTextOnDarkBackgrounds = True,
.InputImageType = IronOcr.AdvancedOcr.InputTypes.AutoDetect,
.RotateAndStraighten = True,
.ReadBarCodes = True,
.ColorDepth = 4
}
Private Sub Form1_Load(sender As Object, e As EventArgs) Handles MyBase.Load
Dim Result = Ocr.Read("D:\ImageFileforOCR.png")
oWord = OpenAWordFile()
oDoc = oWord.Documents.Add()
DocfileSetup(oDoc)
oWord.Selection.(Text:=txtOCR)
End Sub
Однако сохраненный результат не отформатирован в соответствии с документом изображения. Стили шрифта, размер шрифта, полужирный / обычный шрифт, подчеркивание, выравнивание абзацев, нумерация абзацев и т. Д. c теряются в файле MS-Word.
Может кто-нибудь подсказать, как сохранить Page Setup
и text format
при сохранении результатов в файл MS-Word
.