Существует ли ограничение по страницам для прогнозирования с использованием GCP AutoML для извлечения пользовательских объектов - PullRequest
1 голос
/ 28 февраля 2020

Я пытаюсь исследовать извлечение пользовательских сущностей с помощью GCP AutoML, у меня есть 10-страничные документы, используемые для обучения модели, где мои сущности обучаются также на 7 и 8 страницах.

Во время тестирования из пользовательского интерфейса GCP AutoML я использовал только один из обученных документов, он не может извлечь объекты за пределы первых 5 страниц. - Это ограничение по умолчанию страницы разрешено на данный момент? - Или это настраиваемое, которое можно изменить, если да, как это сделать - Или мы можем запросить поддержку GCP, чтобы рассмотреть полную длину документа?

Любые указатели оценены.

1 Ответ

0 голосов
/ 28 февраля 2020

Ограничения для извлечения сущности не допускают документов длиной более 10000 символов, и, насколько я знаю, это нельзя изменить. Функция извлечения сущностей API обработки естественного языка предназначена для анализа сущностей в коротких документах, поэтому, если вам нужно работать с более длинными документами, я бы посоветовал вам разделить их на небольшие партии.

Надеюсь, это поможет.

...