Есть ли какая-либо опция в Google Cloud Vision API для обнаружения и возврата таблицы (строки и столбцы с заголовками) из отсканированного изображения? - PullRequest
0 голосов
/ 02 мая 2018

Мы используем API Google Cloud Vision для извлечения полей счетов. Мы хотели бы знать, поддерживают ли API-интерфейсы обнаружение таблицы данных? Или мы должны написать собственный код для обнаружения таблиц?

1 Ответ

0 голосов
/ 08 мая 2018

Google Vision API не будет возвращать данные из форм в структурированном виде. Однако координаты полигонов, которые окружают текст (boundingPoly), будут предоставлены в ответе. Взгляните на этот пример :

{
     "description": "ABBEY",
     "boundingPoly": {
         "vertices": [ {
             "x": 44,
             "y": 43
             }, ...
          ] }, ...
}

Один из подходов, который вы можете использовать, - это определить координаты поля в вашем счете-фактуре, а затем написать некоторый код для итерации по объектам boundingPoly вашего ответа JSON, чтобы проверить, перекрывает ли область, в которой лежат вершины, некоторую степень с регион ваших полей. Если координаты boundingPoly находятся в том же регионе, что и ваши поля, то - например, с помощью Python - вы можете сопоставить эти слова, используя словарь, с именами полей.

...