Разделение текстовых строк на изображении - Интуиция параметра порога и значения бина гистограммы - PullRequest
0 голосов
/ 10 октября 2019

Я хотел разделить строки текста в отсканированном документе и нашел этот код полезным в вопросе: -

Разделение строк текста в отсканированном документе

Однако яя не могу понять, что на самом деле означает эта часть кода на python:части изображения и черные ячейки, содержащие текст.

Что представляет собой значение в переменной 'hist'?

Например: hist [3098] = 10 ... Что означает 10 ---?> Представляет ли значение ячейки гистограммы длину текста или интенсивность пикселя или я неправильно его интерпретирую? Я не могу понять, на что мне нужно поставить порог.

ПРИМЕЧАНИЕ: - Я понимаю, что это может показаться дублирующим вопросом, но мой вопрос не в том, как разделить текстовые строки в отсканированном документе, а в том, какова интуиция в значениях бина гистограммы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...