Когда я пытаюсь обучить модель с 5 PDF-файлами, я получаю ответ 200 от сервера API, и все документы не имеют ошибок и имеют статус успеха, но ошибка самого ответа возвращает: {'errorMessage' : «Невозможно извлечь пары ключ / значение. индекс списка вне диапазона '}. Похоже, что на сервере API может быть ошибка.
Я успешно обучил модель и проанализировал PDF-файлы, предоставленные в качестве образцов счетов-фактур. И запрос API обучения для моих данных возвращает результат 200. Таким образом, на стороне сервера действительно что-то не так. Возможно, что-то вызвано данными, которые я отправляю? Но я не могу получить доступ к трассе ошибки, очевидно.
########### Python Form Recognizer Train #############
from requests import post as http_post
# Endpoint URL
base_url = r"https://westus2.api.cognitive.microsoft.com/" + "/formrecognizer/v1.0-preview/custom"
source = r"https://formrecognizerblob1.blob.core.windows.net/$root/...
headers = {
# Request headers
'Content-Type': 'application/json',
'Ocp-Apim-Subscription-Key': <key>,
}
url = base_url + "/train"
body = {"source": source}
try:
resp = http_post(url = url, json = body, headers = headers)
print("Response status code: %d" % resp.status_code)
print("Response body: %s" % resp.json())
except Exception as e:
print(str(e))
Выполнение вышеуказанного кода (с моими 5 PDF-файлами в корневом контейнере моего хранилища BLOB-объектов) возвращает:
Код статуса ответа: 200
Тело ответа: {'modelId': 'e6dd8978-dfcc-438b-b0b2-639c13327cdf', 'trainingDocuments': [{'documentName': '.pdf', 'pages': 5, 'errors': [], 'status ':' success '}, {' documentName ':' .pdf ',' pages ': 4,' errors ': [],' status ':' success '}, {' documentName ':' .pdf ',' pages ': 17,' errors ': [],' status ':' success '}, {' documentName ':' .pdf ',' pages ': 7,' errors ': [],' status ':' success '}, {' documentName ':' .pdf ',' pages ': 11,' errors ': [],' status ':' success '}],' errors ': [{' errorMessage ':' Невозможно извлечь пары ключ / значение. индекс списка вне диапазона '}]}