Я пытаюсь использовать коэффициент корреляции Пирсона в MATLAB для выбора признаков в моих данных.У меня есть таблица 21392x1974, с 1974 столбцами в качестве переменных / объектов и 21392 строк в качестве наблюдений.Я изучил документацию Mathworks по corrcoeff (), но большинство примеров приведены для данных небольшого размера.Я совершенно не понимаю, как применить его к такому огромному набору данных.Кроме того, я не уверен, можно ли применить коэффициент корреляции Пирсона к 1974-му столбцу моих данных, который имеет различные метки строкового типа (например, Apple, Ball, Cat и т. Д. - всего 14 различных классов меток).Моя цель: -
- Рассчитать коэффициент корреляции Пирсона между 7-м столбцом и каждым столбцом моих данных.Таким образом, 7-й столбец будет генерировать идеальную корреляцию (1), поскольку она коррелирует с самим собой.Моя цель - выяснить, насколько все функции связаны с 7-м столбцом данных.Я также хотел бы отобразить индексы столбцов в исходных данных, для которых коэффициент корреляции Пирсона составляет> = 0,70.
- Во-вторых, я хотел бы знать, возможно ли найти коэффициент корреляции Пирсона между 1974-м столбцом)/ классы) против каждого столбца моих данных в качестве второго сценария, который я хотел бы выяснить.Я смотрел на различные ресурсы, такие как http://matlab.izmiran.ru/help/techdoc/ref/corrcoef.html и https://uk.mathworks.com/help/matlab/ref/corrcoef.html, но я действительно не понимаю, как это можно сделать для моих данных.Любая помощь в этом отношении будет принята с благодарностью.Ура и спасибо!