У меня есть набор данных с 5 столбцами, соответствующими 5 экзаменам и 1000 строк, каждый из которых соответствует студенту, каждый столбец заполнен 5 классами (категориальными), и система оценок одинакова для всех 5 экзаменов. Как мне закодировать эти данные, чтобы использовать алгоритмы кластеризации, такие как K-means, SOM и т. Д.
Я уже пробовал K-режимы в R с необработанными категориальными данными, но я не уверен, что это правильный путь, поскольку категории имеют порядковый характер, а категории в столбцах одинаковы.
ОБРАЗЕЦ ДАННЫХ