Тессеракт OCR в C# Обнаружение первого символа - PullRequest
0 голосов
/ 04 февраля 2020

Я использую tesseract 3.03 в Visual Studio C#.

Моя проблема заключается в обнаружении первого символа, а не всего текста.

Я хочу быстро проверить, есть ли на изображении текст или нет, когда обнаруженный символ перемещает другую папку.

, если Первый символ не "" или "" не (пробел), я хочу выход из процесса, потому что иногда ocr получает несколько "" Пробелы Мои коды ..

private void TextBul()
        {
            String linki = @filePaths[index];
            var img = new Bitmap(linki);

            var ocr = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default);
            var page = ocr.Process(img);
            Texti  = page.GetText();

            img.Dispose();

            Texti = Regex.Replace(Texti, @"\s+", "");
            if (Texti.Length < 1)
            {
                richTextBox1.Text ="No Text";
            }
            else 
            { 
                richTextBox1.Text =Texti;
                var filename = Path.GetFileName(linki);
                richTextBox2.Text = filename;

                string Tasinacak = Path.Combine(HedefKlasor, filename);

                textBox1.Text = linki;
                textBox2.Text = Tasinacak;

                try
                {
                    File.Move(@linki,@Tasinacak);
                }
                catch (Exception e)
                {

                    richTextBox1.Text = e.Message;
                }

            }
            index++;
            label1.Text = index.ToString();
        }
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...