Я постараюсь решить ваши проблемы как можно лучше следующим образом:
1) Согласно документации LUIS,
Следовательно, вы не можете превысить лимит. В случае приложений Dispatch, , если общее высказывание превышает 15 КБ, тогда диспетчеризация снизит выборку высказываний, чтобы оставить ее ниже 15 К . Для CLI имеется необязательный параметр ( - doAutoActiveLearning ), позволяющий автоматически активировать обучение, которое будет интеллектуально уменьшать выборку (удаляя несоответствующие высказывания).
- doAutoActiveLearning: (необязательно) ложный. Ограничение LUIS на размер обучающего набора составляет 15000. Когда приложение LUIS имеет гораздо больше высказываний для обучения, автоматический процесс обучения Dispatch может интеллектуально понизить выборки высказываний.
2) Проверка орфографии Bing помогает пользователям исправлять слова с ошибками в высказываниях перед тем, как LUIS предсказывает оценку и сущности высказывания. Однако, если вы хотите избежать использования API-интерфейса Bing Spell Check, тогда вам нужно будет добавить правильное и неправильное написание , что можно сделать двумя способами:
- Пример метки высказывания, которые имеют все различные варианты написания, так что LUIS может выучить как правильное написание, так и опечатки. Этот параметр требует больше усилий для маркировки, чем при использовании средства проверки орфографии.
- Создайте список фраз со всеми вариациями слова. С этим решением вам не нужно маркировать варианты слов в приведенных в качестве примера высказываниях.
3) Согласно текущей документации допускается максимум 1000 высказываний на тест , Набор данных представляет собой JSON -форматированный файл, содержащий не более 1000 помеченных не дублированных высказываний. Вы можете протестировать до 10 наборов данных в приложении. Если вам нужно проверить больше, удалите набор данных, а затем добавьте новый. Я бы посоветовал вам сообщить об этом как запрос функции на форуме обратной связи .
Надеюсь, это поможет.