Разброс сюжета рукописных цифр - PullRequest
1 голос
/ 21 января 2012

Я хочу создать точечный график рукописных цифр от 0 и 1 (http://yann.lecun.com/exdb/mnist/). Я взял 4 образца, т.е. два 0 и два 1.

Каждая рукописная цифра имеет значения пикселей, имеющие размерность 1, 778 матрица.

Теперь я хочу сделать диаграмму рассеяния этих цифр в двух измерениях, чтобы проверить, являются ли они разделимыми или нет.

Я пытался построить их в R, но окончательный график - это просто смесь точек. Как мне построить, чтобы диаграмма разброса каждой цифры отличалась от другой? я двигаюсь в правильном направлении при построении?

Пожалуйста, сообщите.

1 Ответ

2 голосов
/ 21 января 2012
  1. Они, вероятно, отделимы, поэтому вам не нужно проверять это.

  2. Если вы хотите знать, являются ли они отделимыми, правильный способ - использовать такой классификатор, как SVM.

    Вы пытаетесь уменьшить размеры из 4 цифр (4x778) в два измерения (4x2). Есть много способов сделать это, и ни один не идеален. После уменьшения размеров некоторая информация всегда теряется, так что это всего лишь приблизительный способ определить, являются ли многомерные данные разделимыми.

    Самый распространенный / простой способ сокращения данных до двух (или любого числа) измерений называется PCA .

...