Использование AutoML Natural Language прямо сейчас ведет себя следующим образом:
1) При подаче полезной нагрузки PDF для онлайн-прогноза кажется, что обрабатываются только 5 страниц PDF (PDF < 2MB). Я пробовал 8-страничные и 11-страничные PDF-файлы, и каждый раз обрабатывается только 5 страниц.
https://cloud.google.com/automl/docs/reference/rest/v1/projects.locations.models/predict - sidenote: вероятно, опечатка (20 МБ должно быть 2 МБ ) в документах:
Извлечение сущности AutoML на естественном языке - TextSnippet до 10000 символов, кодированный UTF-8 NF C или документ в формате .PDF, .TIF или .TIFF с размером до 20 МБ.
2) переменная response.preprocessedInput.document.layout
не соответствует документации, в которой говорится (https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google .cloud.automl.v1.Document ):
Описывает макет документа. Отсортировано по [page_number] [].
Вместо этого переменная layout
представляется просто одним длинным массивом токенов.
Есть мысли о том, что я где-то напутал?