AutoML естественный язык неожиданный прогноз поведения - PullRequest
0 голосов
/ 31 марта 2020

Использование AutoML Natural Language прямо сейчас ведет себя следующим образом:

1) При подаче полезной нагрузки PDF для онлайн-прогноза кажется, что обрабатываются только 5 страниц PDF (PDF < 2MB). Я пробовал 8-страничные и 11-страничные PDF-файлы, и каждый раз обрабатывается только 5 страниц.

https://cloud.google.com/automl/docs/reference/rest/v1/projects.locations.models/predict - sidenote: вероятно, опечатка (20 МБ должно быть 2 МБ ) в документах:

Извлечение сущности AutoML на естественном языке - TextSnippet до 10000 символов, кодированный UTF-8 NF C или документ в формате .PDF, .TIF или .TIFF с размером до 20 МБ.

2) переменная response.preprocessedInput.document.layout не соответствует документации, в которой говорится (https://cloud.google.com/automl/docs/reference/rpc/google.cloud.automl.v1#google .cloud.automl.v1.Document ):

Описывает макет документа. Отсортировано по [page_number] [].

Вместо этого переменная layout представляется просто одним длинным массивом токенов.

Есть мысли о том, что я где-то напутал?

...