Я обнаружил, Тессеракт OCR довольно солидно для проекта с открытым исходным кодом. Я обнаружил, что он может даже читать и декодировать простые капчи, такие как Megaupload. Я думаю, что с небольшой настройкой это может сработать очень хорошо.
Единственная боль в том, что он принимает только несжатые изображения TIFF, что может раздражать.
РЕДАКТИРОВАТЬ: Филипп Даубмайер уже нашел интеграцию .NET, но ниже приведен код для преобразования растрового изображения в несжатый формат TIFF.
private void ConvertBitmapToTIF(Bitmap convert)
{
ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;
EncoderParameters parms = new EncoderParameters(2);
EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
parms.Param[0] = param0;
parms.Param[1] = param1;
convert.Save("output.tif", codecInfo, parms);
}
Это сохраняет в файл, но метод Bitmap.Save может также записывать в поток.