Как правильно кодировать категориальные данные перед использованием SOM ​​для кластеризации? - PullRequest
0 голосов
/ 02 июня 2019

У меня есть набор данных с 5 столбцами, соответствующими 5 экзаменам и 1000 строк, каждый из которых соответствует студенту, каждый столбец заполнен 5 классами (категориальными), и система оценок одинакова для всех 5 экзаменов. Как мне закодировать эти данные, чтобы использовать алгоритмы кластеризации, такие как K-means, SOM и т. Д.

Я уже пробовал K-режимы в R с необработанными категориальными данными, но я не уверен, что это правильный путь, поскольку категории имеют порядковый характер, а категории в столбцах одинаковы. ОБРАЗЕЦ ДАННЫХ

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...