Я бы хотел постепенно обучать NER Spacy Model .
Постепенно я имею в виду отправку первой партии из N обучающих выборок, получение первой модели, затем отправку второй партии из M обучающих выборок и получение модели, идентичной, как если бы N + M выборок было отправлено водна партия и модель обучены.
Для ясности, речь не идет о добавлении образцов после полной тренировки модели.Вместо этого это возможность сохранять промежуточные состояния в модели, чтобы мы могли «возобновить» и добавить больше обучающих выборок.
Это очень полезно, если число выборок велико или для создания систем «активного обучения».
Это кажется выполнимым с NLTK в соответствии с этой статьей : и мне было интересно, можно ли это сделать с помощью Spacy.
До сих пор я обучил свой собственный NERмодель со Spacy, использующая nlp.update, но, похоже, она не хранит промежуточное состояние, поддерживающее добавочное обучение.