Ошибка индекса вне границ, возвращенная с сервера API Recognizer формы по запросу поезда - PullRequest
0 голосов
/ 14 июня 2019

Когда я пытаюсь обучить модель с 5 PDF-файлами, я получаю ответ 200 от сервера API, и все документы не имеют ошибок и имеют статус успеха, но ошибка самого ответа возвращает: {'errorMessage' : «Невозможно извлечь пары ключ / значение. индекс списка вне диапазона '}. Похоже, что на сервере API может быть ошибка.

Я успешно обучил модель и проанализировал PDF-файлы, предоставленные в качестве образцов счетов-фактур. И запрос API обучения для моих данных возвращает результат 200. Таким образом, на стороне сервера действительно что-то не так. Возможно, что-то вызвано данными, которые я отправляю? Но я не могу получить доступ к трассе ошибки, очевидно.

########### Python Form Recognizer Train #############
from requests import post as http_post

# Endpoint URL
base_url = r"https://westus2.api.cognitive.microsoft.com/" + "/formrecognizer/v1.0-preview/custom"
source = r"https://formrecognizerblob1.blob.core.windows.net/$root/...
headers = {
    # Request headers
    'Content-Type': 'application/json',
    'Ocp-Apim-Subscription-Key': <key>,
}
url = base_url + "/train" 
body = {"source": source}
try:
    resp = http_post(url = url, json = body, headers = headers)
    print("Response status code: %d" % resp.status_code)
    print("Response body: %s" % resp.json())
except Exception as e:
    print(str(e))

Выполнение вышеуказанного кода (с моими 5 PDF-файлами в корневом контейнере моего хранилища BLOB-объектов) возвращает:

Код статуса ответа: 200 Тело ответа: {'modelId': 'e6dd8978-dfcc-438b-b0b2-639c13327cdf', 'trainingDocuments': [{'documentName': '.pdf', 'pages': 5, 'errors': [], 'status ':' success '}, {' documentName ':' .pdf ',' pages ': 4,' errors ': [],' status ':' success '}, {' documentName ':' .pdf ',' pages ': 17,' errors ': [],' status ':' success '}, {' documentName ':' .pdf ',' pages ': 7,' errors ': [],' status ':' success '}, {' documentName ':' .pdf ',' pages ': 11,' errors ': [],' status ':' success '}],' errors ': [{' errorMessage ':' Невозможно извлечь пары ключ / значение. индекс списка вне диапазона '}]}

1 Ответ

0 голосов
/ 14 июня 2019

Это действительно похоже на бэкэнд-баг.Если вы сможете поделиться данными, которые вы использовали для обучения, я мог бы провести дополнительное расследование.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...