Я хотел разделить строки текста в отсканированном документе и нашел этот код полезным в вопросе: -
Разделение строк текста в отсканированном документе
Однако яя не могу понять, что на самом деле означает эта часть кода на python:части изображения и черные ячейки, содержащие текст.
Что представляет собой значение в переменной 'hist'?
Например: hist [3098] = 10 ... Что означает 10 ---?> Представляет ли значение ячейки гистограммы длину текста или интенсивность пикселя или я неправильно его интерпретирую? Я не могу понять, на что мне нужно поставить порог.
ПРИМЕЧАНИЕ: - Я понимаю, что это может показаться дублирующим вопросом, но мой вопрос не в том, как разделить текстовые строки в отсканированном документе, а в том, какова интуиция в значениях бина гистограммы.