У меня есть набор данных:
- почти 45К образцов
- 8 функций
- 4 класса
Процент выборок для каждого класса различен. Я хотел нарисовать все точечные диаграммы для каждой пары комбинации, то есть 28 диаграмм и с учетом всего набора данных.
Итак, в конце я получаю для каждого графика разброс, где я вижу образцы, распределенные по классам.
Так как я видел в книге пример, где они строят эти разброски, рассматривая одинаковое количество образцов для каждого класса.
Например: 100 образцов класса 0, 100 образцов класса 1, 100 образцов класса 2, 100 образцов класса 3.
Вопрос: Мне интересно, правильно ли считать все наборы данных с разным процентом для каждого класса?
Примечание: Я хочу получить представление о том, являются ли элементы, взяв их попарно, линейно разделимыми или нет.