Должен ли я использовать PCA, где есть столбец, который является суммой других? - PullRequest
0 голосов
/ 26 января 2020

У меня go набор данных, связанный с некоторыми сообщениями Facebook. Для каждого поста хранится следующая информация:

status_id,status_type,status_published,num_reactions,num_comments,num_shares,num_likes,num_loves,num_wows,num_hahas,num_sads,num_angrys

Я должен их кластеризовать. Поскольку столбец «num_reactions» является суммой для каждого поста столбцов «num_comments», «num_likes», «num_loves», «num_wows», «num_hahas», «num_sads», «num_angrys», я подумал выполнить PCA, во-первых, потому что есть корреляция между этими функциями, во-вторых, для визуализации результатов кластеризации.

Это хорошая идея?

...