Я построил модель Keras с существующими текстовыми данными.Теперь, когда я получаю больше данных для добавления, какие шаги необходимы для эффективного обновления моей предыдущей модели.Моя главная проблема заключается в том, что если я случайно начну добавлять данные, не предсказывая, что класс будет создан, подобный класс будет создан, если новые данные содержат дублирующиеся тексты, что может привести к плохой точности модели.
Ранее я думал, есть ли способтестировать и обучать одновременно, чтобы избежать добавления дубликатов данных, но не смог найти решение.