Набор данных выглядит так, это один набор данных с горячим кодированием, и я хочу сделать кластеризацию kmeans на нем, какие-либо предложения?