Заставить Google Cloud Vision читать текст слева направо, сверху вниз - PullRequest
0 голосов
/ 13 февраля 2019

Я пытаюсь автоматизировать задачу извлечения информации из набора документов PDF.Причина, по которой я использую Cloud Vision, заключается в том, что документы защищены и поэтому не могут быть проанализированы с помощью традиционных методов.Документы являются чисто цифровыми, то есть без отпечатков или около того - поэтому распознавание символов, как и ожидалось, работает безупречно.Однако слова не читаются в том порядке, в котором я их хочу.Чтобы я мог обрабатывать их так легко, как мне хотелось бы, я бы хотел, чтобы Cloud Vision всегда читал слово выше (или если на той же строке слева от) другогоодин.

Однако, это не относится к моим экспериментам.Несмотря на то, что формат этих документов чрезвычайно стандартизирован, а две страницы могут выглядеть практически одинаково, их порядок может сильно различаться.

Я использую тип функции "DOCUMENT_TEXT_DETECTION" в своем запросе, поскольку я понял, что это лучший вариант в моей ситуации.Есть ли дополнительные возможности для этого (я использую клиентскую библиотеку Node)?

...