за мой экзамен, основанный на обработке данных, мы получили небольшой набор данных симпсонов из 4 символов (Барт, Гомер, Лиза, Мардж) для построения сверточной нейронной сети.Тем не менее, набор данных содержит лишь небольшое количество изображений: около 2200, которые можно разделить на тестирование и обучение.
Поскольку я очень плохо знаком с нейронными сетями и глубоким обучением, допустимо ли увеличивать мои данные (яЯ поворачиваю изображения на X градусов 9 раз), а потом делю свои данные, используя функцию testtrainsplit от sklearn.
Поскольку я внес это изменение, после 50 эпох я получаю точность обучения и проверки около 95%с моей текущей моделью.Поскольку это больше, чем я ожидал получить, я начал задавать вопрос, допускается ли в основном расширение тестовых данных без предвзятого или неправильного результата.
так:
a) МожетВы расширяете свои данные перед тем, как разделить их с помощью sklearn TrainTestSplit, не влияя на результаты неверным образом?
б) если мой метод неверен, какой другой метод я могу попробовать?
Заранее спасибо!