Получение ошибки «ValueError: Найдены входные переменные с непоследовательным количеством выборок: [35, 311]» в алгоритме ML knn с python - PullRequest
0 голосов
/ 28 марта 2019

Я пытаюсь попрактиковаться в этом коде для ML, но я сталкиваюсь с некоторой ошибкой, говоря: «ValueError: Найдены входные переменные с непоследовательным количеством выборок: [70, 276]»

код следующий:

    X = Feature
    X[0:5]
    y = df['loan_status'].values
    y[0:5]
    X= preprocessing.StandardScaler().fit(X).transform(X)
    X[0:5]
    from sklearn.metrics import jaccard_similarity_score, log_loss, 
    f1_score
    from sklearn.model_selection import train_test_split
    from sklearn.neighbors import KNeighborsClassifier



    #Split data....also face error here
    Xtrn, Xtst, ytrn, ytst = train_test_split(X, y, test_size=0.2, 
    random_state=6)
    #Lets k=6
    k = 6
    knn= KNeighborsClassifier(n_neighbors = k).fit(Xtrn,ytrn)
    knn
    y_pred = knn.predict(Xtrn)
    y_pred[0:5]


    #-----face error here
    print("Jaccard Score in train set= ", jaccard_similarity_score(ytrn, 
    knn.predict(Xtrn)))
    print("F1 Score in train set= ", f1_score(ytrn, knn.predict(Xtrn), 
    average='weighted'))
    print("F1 Score in test set=  ", f1_score(ytst, y_pred, 
    average='weighted'))
    print("Jaccard Score in test set= ", jaccard_similarity_score(ytst, 
    y_pred))

1 Ответ

0 голосов
/ 28 марта 2019

X и Y не в правильной форме для train_test_split.Попробуйте проверить их формы.

Используйте метод shape.Например - X.shape

Затем используйте метод reshape, чтобы выровнять обе фигуры.

...