Одной из сложных тем в компьютерном зрении является обработка отсканированных документов. Обычно это включает в себя ряд шагов, таких как удаление шума, анализ цвета, бинаризация, идентификация текстового блока, распознавание текста, а затем, возможно, некоторый контекстный анализ и исправление.
Мне любопытно, если кто-то понимает, знает или может указать мне на литературу о том, как Google идентифицирует текстовые блоки до стадии OCR. Есть идеи?