Очистка изображения капчи и последующее использование Tesseract OCR (. NET) - PullRequest
0 голосов
/ 20 апреля 2020

Я имею дело с новой механикой капчи изображений в моем боте-утилите, после некоторой попытки с ImageMagick, с которой я более знаком, мне не повезло.

эти изображения капчи из этого вида: text

и конкретные c образцы:

text

text

text

после Ища какое-то решение для этих специфических c изображений капчи Я нашел этот вопрос:

Очистка изображения капчи

и есть фантастическое решение c, предлагаемое Simon Mourier

к сожалению, хотя с использованием того же самого точного кода, который я предложил, я не получил такие же хорошие чистые результаты:

text

text

text

Время от времени я оставлял с сильными замаскированными линиями и несколькими точками, я подозреваю, что это связано с более новой версией OpenCvSharp, которую я сейчас использую, так как использованная при включенном решении в то время не рекомендуется (я пытался добавить более старую версию из время решения проблемы, но возникли конфликты и ошибки времени выполнения с моей текущей версией net, вероятно). теперь я использую пакеты Nuget для OpenCvSharp4 & OpenCvSharp4.runtime.win.

Есть идеи, как получить такие же чистые результаты? или какие корректировки кода могут быть сделаны для достижения этого? Часть OCR, которую я уже реализовал, работает хорошо.

Спасибо!

...