Неуправляемое машинное обучение с scikit learn - PullRequest
0 голосов
/ 13 ноября 2018

Я узнаю о неконтролируемом машинном обучении с помощью scikit learn. Я собрал так данные из онлайн. когда я пытаюсь применить точечный график, я получаю следующую ошибку

IndexingError: Слишком много индексаторов

Вот код:

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
X_com = df.att10
plt.scatter(X_com.iloc[:,0],X_com.iloc[:,1])
plt.show()

Я хочу применить здесь KMeans алгоритм из scikit learn. Что я делаю не так? Заранее спасибо

Ответы [ 2 ]

0 голосов
/ 13 ноября 2018

Может быть, вы захотите увидеть распространение данных относительно первых двух функций.Затем вы должны нарезать его из исходного набора данных, а не из серии (как @Alexandre metioned)

data = arff.loadarff("./Data/Arrhythmia/Arrhythmia_withoutdupl_02_v01.arff")
df = pd.DataFrame(data[0])
df = df.drop(['outlier',"id"],axis=1)
plt.scatter(df.iloc[:,0],df.iloc[:,1])
plt.show()
0 голосов
/ 13 ноября 2018

X_com - это pd.Series, поэтому, когда вы пытаетесь нарезать его с помощью .iloc, вы можете указать только одну ось.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...