Можно ли использовать кластеризацию k-средних для определения классификаций в распознавании? - PullRequest
0 голосов
/ 10 декабря 2018

Я делаю проблему распознавания (лица) и пытаюсь уменьшить размер проблемы.Первоначально я начал с обучения данных в функциональной системе координат в 120 измерениях, но с помощью PCA я нашел лучшую компьютерную систему координат, требующую только 20 измерений, в то же время передавая 95% данных.

Я началполагая, что признание по определению является проблемой классификации.Точки в n-пространстве принадлежат одному и тому же объекту / лицу / всему, что будет кластеризовано.Например, если в обучающих данных есть 5 экземпляров одного и того же человека, они будут кластеризованы, а средняя точка этого кластера может быть численно определена с использованием k-средних.

У меня есть 100 000 наблюдений, каждоечеловек представлен 5-10 выстрелами в голову, это означает, что вместо того, чтобы сравнивать новый ввод с 100 000 точек в моем 20-пространстве, я мог бы вместо этого сравнить с 10000-20 000 центроидов.Можно ли таким образом использовать k-средства или я неверно истолковал?Очевидно, что k не определено, но я читал о том, как найти оптимальное k.

Моя конкретная проблема распознавания - это не нейронные сети, а простые арифметические евклидовы расстояния между точками.

...