Я пытаюсь найти ограничительные рамки (прямоугольники) текста на изображении.Итак, я люблю сканировать все изображение сразу и получить всю текстовую область.Проблема заключается в том, что некоторые тексты игнорируются, а немногие объединяются.Группировка должна быть мудрой.Он не должен быть сгруппирован, имея более одного слова.Каждое слово должно иметь свой прямоугольник.Я использую код, указанный ниже.
int COCR::method_gradient(int nonGradient, int showOutput)
{
Mat large = imread(INPUT_FILE);
Mat rgb;
rgb = large; //--> change
Mat small;
cvtColor(rgb, small, CV_BGR2GRAY);
// morphological gradient
Mat grad;
Mat morphKernel;
if (!nonGradient)
{
morphKernel = getStructuringElement(MORPH_ELLIPSE, Size(3, 3));
morphologyEx(small, grad, MORPH_GRADIENT, morphKernel);
}
else
grad = small;
// binarize
Mat bw;
threshold(grad, bw, 0.0, 255.0, THRESH_BINARY | THRESH_OTSU);
// connect horizontally oriented regions
Mat connected;
morphKernel = getStructuringElement(MORPH_RECT, Size(9, 1));
morphologyEx(bw, connected, MORPH_CLOSE, morphKernel);
// find contours
Mat mask = Mat::zeros(bw.size(), CV_8UC1);
vector<vector<Point>> contours;
vector<Vec4i> hierarchy;
findContours(connected, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE, Point(0, 0));
if (nonGradient)
rgb = MatGradient;
// filter contours
for (int idx = 0; idx >= 0; idx = hierarchy[idx][0])
{
Rect rect = boundingRect(contours[idx]);
Mat maskROI(mask, rect);
maskROI = Scalar(0, 0, 0);
// fill the contour
drawContours(mask, contours, idx, Scalar(255, 255, 255), CV_FILLED);
// ratio of non-zero pixels in the filled region
double r = (double)countNonZero(maskROI) / (rect.width*rect.height);
if (r > .25 /* assume at least 25% of the area is filled if it contains text */
&&
(rect.height > 8 && rect.width > 8)
)
{
rectangle(rgb, rect, Scalar(0, 255, 0), 2);
}
}
if (!nonGradient)
MatGradient = rgb;
if (showOutput)
imwrite(OUTPUT_FOLDER_PATH, rgb);
return 0;
}
// calling
COCR obj_ocr;
obj_ocr.method_gradient(0, 0);
obj_ocr.method_gradient(1, 1);
source img Обратите внимание на красную часть. output img
source_2 Пожалуйста, смотрите красную часть. output_2
, пожалуйста, посоветуйте, как я могу исправить показ отсутствующей области в красном затмении.