Выполните OCR через MODI для определенного региона вместо всего документа - PullRequest
1 голос
/ 09 апреля 2019

Я пытаюсь выполнить массовое распознавание изображений в выбранном каталоге через MODI.Вот код.

private void button1_Click(object sender, EventArgs e) {
            CommonOpenFileDialog dialog = new CommonOpenFileDialog {
                InitialDirectory = "C:\\Users",
                IsFolderPicker = true
            };
            if (dialog.ShowDialog() == CommonFileDialogResult.Ok) {
                invoicePath = dialog.FileName;
                CheckFileAndDoOCR(imageDirectory);

            }
        }

public string CheckFileAndDoOCR(string directoryPath) {
            string TheTxt = "";
            IEnumerator files = Directory.GetFiles(directoryPath).GetEnumerator();

            while (files.MoveNext()) {
                FileInfo foo = new FileInfo(Convert.ToString(files.Current));

                if (foo.Extension == ".jpg" || foo.Extension == ".JPG") {
                    TheTxt = DoOCR(foo.FullName);
                    string txtFileName = foo.DirectoryName + "\\" + foo.Name.Replace(foo.Extension, "") + ".txt";
                    FileStream createFile = new FileStream(txtFileName, FileMode.OpenOrCreate);
                    StreamWriter writeFile = new StreamWriter(createFile);
                    writeFile.Write(TheTxt);
                    writeFile.Close();
                    createFile.Close();
                }
                try {
                    foo.Delete();
                }
                catch (Exception ex) {
                    MessageBox.Show(ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
                }
            }
            return TheTxt;
        }
public string DoOCR(string FullPath) {
            MODI.Document miDoc;
            MODI.Word miWord;
            MODI.IMiRects miRects;
            MODI.IMiRect miRect;
            string strRectInfo;
            miRect = null;

            string txt;
            string word;
            MODI.Document md = new MODI.Document();
            md.Create(FullPath);
            md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, false, false);
            MODI.Image image = (MODI.Image)md.Images[0];
            txt = image.Layout.Text;
            word = null;
            image = null;
            md.Close(false);
            md = null;
            GC.Collect();
            GC.WaitForPendingFinalizers();
            return txt;
        }

Как выполнить оптическое распознавание в определенной области, например

Rectangle Area = new Rectangle() {
                X = 1367,
                Y = 420,
                Height = 57,
                Width = 411
            };

Мне нужно извлечь данные из одного региона / прямоугольника только из всех изображений,Как я могу это сделать?Я пробовал IronOCR и Tesseract, работает как шарм.Но мне сказали использовать MODI.Пожалуйста, помогите.

...