Есть ли хороший показатель того, насколько хорош мой набор данных для задачи классификации. Идеальный сценарий для классификации состоит в том, что точки для каждого класса должны быть сгруппированы ближе, и каждый кластер различных классов должен быть далеко друг от друга. Есть ли способ измерить эту доброту.
Хороший набор данных будет выглядеть так
И плохой набор данных будет выглядеть так
Фон :
Я пытаюсь классифицировать несколько изображений из их 2048-мерных вложений, созданных моделью inception-v3. Я попытался визуализировать модель, уменьшив размерность до 3 размеров, но она теряет много информации. Я пытаюсь выяснить, насколько далеко друг от друга встраиваются мои изображения с одним кластером классов и разными кластерами.