Я работаю над моделью классификации машинного обучения, в которой пользователь может предоставить экземпляры меток, которые должны помочь улучшить модель.
Необходимо уделить больше внимания последним экземплярам, предоставленным пользователем, чем тем экземплярам, которые ранее были доступны для обучения.
В частности, я разрабатываю свои модели машинного обучения на python с использованием библиотек Sklearn.
Пока что я нашел стратегию передискретизации только отдельных экземпляров в качестве возможного решения проблемы. С помощью этой стратегии я бы создал несколько копий экземпляров, для которых я хочу придать большую актуальность.
Другая стратегия, которую я нашел, но, кажется, не помогает в этих условиях:
- Стратегии, нацеленные на предоставление весов для каждого класса. Эта стратегия по умолчанию широко используется во многих библиотеках, таких как Sklearn. Тем не менее, это обобщает идею на уровне класса и не помогает мне сосредоточиться на конкретных случаях
Я искал несколько стратегий, которые могли бы помочь предоставить конкретные веса для отдельных экземпляров, но большинство из них были сосредоточены на уровне класса, а не на уровне уровня экземпляра.
Я прочитал некоторые предложения по умножению функции потерь на некоторые факторы для примеров в моделях тензорного потока, но, по-видимому, это в основном применимо к моделям нейронных сетей в потоке Тензора.
Интересно, есть ли у кого-нибудь информация о других подходах, которые могут помочь с этой проблемой