Возврат отформатированного текста из результатов GCP Vision PDF - PullRequest
6 голосов
/ 23 мая 2019

Я наконец-то получил свой сценарий для отправки PDF-документа в Google Storage, а затем для извлечения текста с использованием Google Vision для PDF, как описано в документации .

Данные возвращаются в огромном файле JSON. Есть один узел, который содержит тест, но он больше не отформатирован. Только разрывы строк обозначены \n. Меня не очень волнуют разрывы строк, а параграфы.

Как вернуть его в отформатированном виде? Существуют ли библиотеки, которые будут работать с GCP для улучшения вывода JSON?

...