распознавание текста внутри изображения - действительно горячая тема для исследователей в этой области, но он начал выходить из-под контроля, когда капча стала "нормой" в плане защиты от спам-ботов. Зачем использовать капчу в качестве защиты? хорошо, потому что было / было очень трудно найти (и прочитать) текст внутри изображения!
Причина, по которой я упоминаю капчу, заключается в том, что наибольшее продвижение * сделано в этой крошечной области, и я думаю, что ваше решение может быть найдено лучше всего там.
особенно потому, что капчи действительно нацелены на то, чтобы найти текст (или что-то похожее на текст) внутри загроможденного изображения и впоследствии попытаться правильно прочитать буквы.
так что если вы можете найти хороший инструмент для разрыва капчи с открытым исходным кодом у вас, вероятно, есть все, что вам нужно для продолжения вашего квеста ...
Вы могли бы даже выбросить самый сложный код, который обрабатывает само распознавание символов, потому что эти OCR используются для чтения искаженного текста, что вам не нужно делать.
*: продвижение в терминах видимой, полезной и практической информации для "не исследователя"