как обнаружить японское слово, используя Google Vision с горизонтальной линией или используя TEXT_DETECTION для обнаружения текста в файлах (PDF) - PullRequest
2 голосов
/ 30 октября 2019

Я использую google vision для определения текста документа в файле PDF, но у меня возникли некоторые проблемы с шириной результата ответа.

  1. Результат ответа отличный, но некоторые символы обнаруживаются вертикальной линией. Я знаю Японию, использующую вертикаль для письма, но мне это не нужно. Как я могу добавить условие для этого.

пример

[a, b, c]

[x, y, z]

[1,2,3]

ожидаемые результаты: [a, b, c], [x, y, z], [1,2,3] или [a], [b], [c], [x], [y], [z], [1], [2], [3]

фактические результаты: [a, b] [x, y] [1,2] [c, z, 3]

, если 1 невозможно. Могу ли я изменить тип функции TEXT_DETECTION?

bounding_box имеют 4 точки

{"x": 0.5579832, "y": 0.912114},

{"x ": 0.5579832," y ": 0.91567695},

{" x ": 0.53781515," y ": 0.91567695},

{" x ": 0.53781515," y ": 0.912114}

и страницы имеют ширину и высоту, но некоторые x, y имеют значение> 1,0. Превышен лимит страниц. Как я могу преобразовать в ширину и высоту с точкой

спасибо ^^

ссылка: https://cloud.google.com/vision/docs/pdf и только изменение image_context = {"language_hints": ["ja"]}

https://medium.com/weareservian/my-tips-for-getting-help-with-google-cloud-platform-114b03f807dc

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...