Я наконец-то получил свой сценарий для отправки PDF-документа в Google Storage, а затем для извлечения текста с использованием Google Vision для PDF, как описано в документации .
Данные возвращаются в огромном файле JSON. Есть один узел, который содержит тест, но он больше не отформатирован. Только разрывы строк обозначены \n
. Меня не очень волнуют разрывы строк, а параграфы.
Как вернуть его в отформатированном виде? Существуют ли библиотеки, которые будут работать с GCP для улучшения вывода JSON?