соотношение между двумя элементами в точечной диаграмме - PullRequest
0 голосов
/ 16 ноября 2018

У меня есть набор данных:

  • почти 45К образцов
  • 8 функций
  • 4 класса

Процент выборок для каждого класса различен. Я хотел нарисовать все точечные диаграммы для каждой пары комбинации, то есть 28 диаграмм и с учетом всего набора данных.

Итак, в конце я получаю для каждого графика разброс, где я вижу образцы, распределенные по классам. Так как я видел в книге пример, где они строят эти разброски, рассматривая одинаковое количество образцов для каждого класса.

Например: 100 образцов класса 0, 100 образцов класса 1, 100 образцов класса 2, 100 образцов класса 3.

Вопрос: Мне интересно, правильно ли считать все наборы данных с разным процентом для каждого класса?

Примечание: Я хочу получить представление о том, являются ли элементы, взяв их попарно, линейно разделимыми или нет.

1 Ответ

0 голосов
/ 16 ноября 2018

Это звучит как Анализ функций или Выбор функций

  1. Если вы хотите узнать из своих графиков, являются ли ваши Функции линейно разделимыми или нет, я бы пошел на все образцыкласса.В противном случае выбор случайного набора, скажем, 100 выборок, позволит вам получить неоднозначные результаты для ваших графиков и, следовательно, интерпретации
  2. При попытке разобраться в особенностях просто качественный «взгляд» на графики не должен заканчиватьсятрубопровода.Скорее обратимся к некоторым достойным стратегиям и подходам выбора признаков, таким как: рекурсивное исключение признаков, матрица корреляции и т. Д. (Здесь некоторые примеры в R для начала)
  3. При попытке понять смыслиз набора функций есть такие методы, как метод ellbow и др.
...