Как распознать конкретную область MODI.Document? - PullRequest
0 голосов
/ 05 марта 2011

Мне нужно OCR для определенной области отсканированного документа, и я использую MODI (COM-объект Document Imaging от Microsoft).

Мой код в настоящее время распознает всю страницу (довольно точно!), Но я хотел бынацеливаться на конкретный регион страницы, где текст всегда статичен (номер заказа).Как я могу это сделать?

Вот мой код для страницы:

MODI.Document md = new MODI.Document();

md.Create("c:\\temp\\mpk.tiff");

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);
MODI.Image image = (MODI.Image)md.Images[0];

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);

StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();

md.Close();

Могу ли я как-то указать регион изображения?

Любая помощь будет оченьоценили!

1 Ответ

2 голосов
/ 05 марта 2011

Нет способа обрезать изображение, которое я вижу, с помощью объектной модели MODI.Альтернатива - предоставить ему изображение, содержащее только номер заказа, который вы хотите преобразовать.Вы можете использовать классы в пространстве имен System.Drawing, чтобы создать его из оригинала.Проверьте эту страницу MSDN для образца кода.

...