Переподготовка и обновление существующей модели Rasa NLU - PullRequest
0 голосов
/ 15 мая 2018

Я использую Rasa NLU для проекта, который предполагает понимание структурированного текста. Мой вариант использования требует, чтобы я продолжал обновлять свой обучающий набор, добавляя новые примеры текстовых объектов. Тем не менее, это означает, что я должен постоянно переучивать свою модель каждые несколько дней, что требует больше времени на то же самое из-за увеличения размера тренировочного набора.

Есть ли способ в NLU Rasa обновить уже обученную модель, только обучая ее новыми данными обучающего набора, вместо повторной переподготовки всей модели, используя весь предыдущий набор обучающих данных и новый набор обучающих данных?

Я пытаюсь найти подход, в котором я могу просто обновить свою существующую обученную модель, обучая ее дополнительным дополнительным данным обучения, устанавливаемым каждые несколько дней.

1 Ответ

0 голосов
/ 16 мая 2018

На сегодняшний день в самой последней проблеме Github в теме говорится, что нет способа переобучить модель, добавив только новые высказывания. То же самое для предыдущих выпусков, цитируемых в нем.

Вы правы: необходимость периодически переучивать все более длинные файлы занимает все больше времени. Хотя переподготовка на месте не является хорошей идеей в производстве.

Отличный пример в комментарии пользователя:

Переподготовка на одной и той же модели может стать проблемой для производственных систем. Раньше я переписывал свои модели, а затем в какой-то момент одна из тренировок не сработала идеально, и я начал видеть критическое падение уверенности в своих ответах. Я должен был найти, откуда возникла проблема, и переобучить модель.

Обучение новой модели все время (с отметкой времени) хорошо, потому что это облегчает откат (и они будут происходить в производственных системах). Затем я получаю самые свежие названия моделей из БД.

...