Я использую tesseract 3.03 в Visual Studio C#.
Моя проблема заключается в обнаружении первого символа, а не всего текста.
Я хочу быстро проверить, есть ли на изображении текст или нет, когда обнаруженный символ перемещает другую папку.
, если Первый символ не "" или "" не (пробел), я хочу выход из процесса, потому что иногда ocr получает несколько "" Пробелы Мои коды ..
private void TextBul()
{
String linki = @filePaths[index];
var img = new Bitmap(linki);
var ocr = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default);
var page = ocr.Process(img);
Texti = page.GetText();
img.Dispose();
Texti = Regex.Replace(Texti, @"\s+", "");
if (Texti.Length < 1)
{
richTextBox1.Text ="No Text";
}
else
{
richTextBox1.Text =Texti;
var filename = Path.GetFileName(linki);
richTextBox2.Text = filename;
string Tasinacak = Path.Combine(HedefKlasor, filename);
textBox1.Text = linki;
textBox2.Text = Tasinacak;
try
{
File.Move(@linki,@Tasinacak);
}
catch (Exception e)
{
richTextBox1.Text = e.Message;
}
}
index++;
label1.Text = index.ToString();
}