Измерение того, как новый образец вносит вклад в разнообразие набора данных - PullRequest
0 голосов
/ 26 марта 2019

Я работаю с набором данных изображений в градациях серого.Есть ли способ определить, что новое изображение в градациях серого может способствовать разнообразию набора данных в градациях серого?Я бы хотел, чтобы в наборе данных не было слишком много похожих образцов.

1 Ответ

0 голосов
/ 28 марта 2019

Ну, что ты видишь, когда смотришь на это? Если у вас есть информация об изображениях в этом наборе данных, вы, вероятно, сами сможете оценить, является ли этот новый образец повторением некоторого шаблона, который уже включен в набор данных, или он является чем-то уникальным.

Другая идея может состоять в том, чтобы сравнивать изображения аналитически. В зависимости от случая вам может потребоваться посмотреть средние значения отдельных пикселей (каждое должно быть в диапазоне от 0 до 255) вашего обучающего набора и сравнить его со значениями пикселей этого образца изображения. Точно так же другие меры могут также работать.

Что бы я сделал, если у вас есть модель, обученная на вашем текущем наборе данных, чтобы использовать модель для прогнозирования / классификации образца изображения, посмотреть, насколько хорошо он работает и с какой уверенностью он работает. Таким образом, возможно, вы сможете оценить, есть ли у вашей модели (и набора данных, с которым вы ее обучали), чему поучиться на этом новом образце изображения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...