ValueError в DL - PullRequest
       3

ValueError в DL

0 голосов
/ 22 октября 2018

Я получаю эту ошибку, после выбора эпох: ValueError: Входные массивы должны иметь то же количество выборок, что и целевые массивы.Найдено 5516 входных и 12870 целевых образцов.Любые предложения приветствуются.Заранее спасибо

Я использую набор данных с большим количеством категориальных переменных, и они добавляют до 95 после создания фиктивных переменных, код до тех пор, пока я не выберу количество эпох, работает без ошибок, а затем я получаю эту ошибку, чтоявляется причиной этой ошибки, важно, во-первых, я мог бы использовать его в будущем и 2, я не могу продолжить:)

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

dataset = pd.read_csv('zrpl_data.csv')
X = dataset.iloc[:, 0:6].values
y = dataset.iloc[:, 6].values

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X_1 = LabelEncoder()
X[:, 0] = labelencoder_X_1.fit_transform(X[:, 0])

labelencoder_X_2 = LabelEncoder()
X[:, 1] = labelencoder_X_2.fit_transform(X[:, 1])
labelencoder_X_3 = LabelEncoder()
X[:, 2] = labelencoder_X_1.fit_transform(X[:, 2])

labelencoder_X_4 = LabelEncoder()
X[:, 3] = labelencoder_X_1.fit_transform(X[:, 3])

labelencoder_X_5 = LabelEncoder()
X[:, 4] = labelencoder_X_1.fit_transform(X[:, 4])

onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3,4])
X = onehotencoder.fit_transform(X).toarray()
X = X[:, 1:]

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.3, 
random_state = 0)

from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

import keras
from keras.models import Sequential
from keras.layers import Dense

classifier = Sequential()

classifier.add(Dense(output_dim=47, 
init='uniform',activation='relu',input_dim=95)) 

classifier.add(Dense(output_dim=47, init='uniform',activation='relu'))
classifier.add(Dense(output_dim=1, 
init='uniform',activation='sigmoid'))

classifier.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

classifier.fit (X_train, y_train, batch_size=10,nb_epoch=100)

1 Ответ

0 голосов
/ 22 октября 2018

У вас есть 5516 образцов и 12870 целевых образцов (вы должны иметь равные), прежде чем обучать модель, дважды проверьте их размеры.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...