Извлечение таблицы из документов на основе изображений - PullRequest
0 голосов
/ 27 ноября 2018

Есть ли эффективный алгоритм / метод для извлечения таблиц из основанных на изображениях документов.У нас также есть вывод Abbyy OCR в виде XML, который имеет информацию о координатах текста в документе.Нам нужно решить 2 основные проблемы:

  1. Идентификация таблицы в документе.(Структура таблицы не является фиксированной. Может иметь разные макеты с ограничительными линиями или без них)
  2. Извлечение текста из таблиц.
...