QNAmaker максимальное количество пар QNA - PullRequest
1 голос
/ 04 марта 2020

Я создаю большой PDF-файл с вопросами для нескольких поворотов.

Я делаю это через браузер, обновление занимает много времени, и в конце он говорит, что он все еще работает в background.

Чтобы проверить, когда он закончится, я позвонил в API, чтобы узнать подробности операции. В конце концов это возвращает, что состояние не удалось без какого-либо кода ошибки.

Когда я проверяю свои пары QnA, у меня есть ровно 1000, что, кажется, не случайное число.

Но Я нигде не могу найти информацию об ограничении пар QnA, оно должно быть неограниченным - вот что я нашел.

Я что-то делаю или что здесь происходит?


edit

Когда я запрашиваю статистику сервера, я получаю ответ. Квота для documentCount равна нулю, что должно означать, что она не ограничена.

` {
    "@odata.context": "mylink",
    "counters": {
        "documentCount": {
            "usage": 2000,
            "quota": null
        },
        "indexesCount": {
            "usage": 2,
            "quota": 3
        },
        "indexersCount": {
            "usage": 0,
            "quota": 3
        },
        "dataSourcesCount": {
            "usage": 0,
            "quota": 3
        },
        "storageSize": {
            "usage": 1714194,
            "quota": 52428800
        },
        "synonymMaps": {
            "usage": 1,
            "quota": 3
        }
    },
    "limits": {
        "maxFieldsPerIndex": 1000,
        "maxIndexerRunTime": "PT1M",
        "maxFileExtractionSize": 16777216,
        "maxFileContentCharactersToExtract": 32768,
        "maxFieldNestingDepthPerIndex": 10,
        "maxComplexCollectionFieldsPerIndex": 40,
        "maxComplexObjectsInCollectionsPerDocument": 3000
    }
} `

edit 2

У меня было несколько повторяющихся вопросов, я удалил их и реорганизовал некоторые вопросы в подзапросы. Я не знаю почему, но теперь загрузка прошла успешно.

1 Ответ

1 голос
/ 05 марта 2020

Согласно странице QnA Maker Limits , к содержанию базы знаний применяются следующие ограничения:

Length of answer text: 25,000
Length of question text: 1,000
Length of metadata key/value text: 100
Supported characters for metadata name: Alphabets, digits and _
Supported characters for metadata value: All except : and |
Length of file name: 200
Supported file formats: ".tsv", ".pdf", ".txt", ".docx", ".xlsx".
Maximum number of alternate questions: 300
Maximum number of question-answer pairs: Depends on the Azure Cognitive Search tier chosen. A question and answer pair maps to a document on Azure Cognitive Search index.
URL/HTML page: 1 million characters

Важной частью является " Пара вопросов и ответов сопоставляется с документом в Azure Индекс когнитивного поиска."

Документация доступна здесь .

Так что если вы На свободном уровне вы можете установить максимальный лимит времени выполнения в 1-3 минуты для индексатора ИЛИ 1 минуту для бесплатных служб в соответствии с верхним индексом 1 под таблицей.

Вы можете попробовать позвонить этот API для получения дополнительной информации, а также убедитесь, что вы находитесь под предельным размером документа .

Редактировать

Возможно, вы заплатите ознакомьтесь с рекомендациями для источника данных QnA Maker , а также с указаниями c для структурированного содержимого PDF здесь . Существует также руководство по форматированию .

QnA Maker определяет разделы и подразделы и отношения в файле на основе визуальных подсказок, таких как:

font size
font style
numbering
colors

Если кто-то в будущем будет бороться с форматированием PDF, то я бы предложил попробовать форматы .docx, xlx или .tsv, поскольку они позволяют вам гораздо более точно указать c в отношении вопроса, и что является ответом

Для документов:

чередование Вопросов и Ответов на строку, один вопрос на строку с последующим ответом в следующей строке

Для электронных таблиц:

Вопрос1 \ t Ответ1 \ t Ключ1: Значение1 | Ключ2: Значение2

Согласно этой ссылке

...