Существует 250 случайно сгенерированных точек данных, которые получаются следующим образом:
[X, y] = getDataSet() # getDataSet() randomly generates 250 data points
X выглядит так:
[array([[-2.44141527e-01, 8.39016956e-01],
[ 1.37468561e+00, 4.97114860e-01],
[ 3.08071887e-02, -2.03260255e-01],...
В то время как y выглядит так:
y is array([[0.],
[0.],
[0.],...
(также содержит 1 с)
Итак, я пытаюсь разделить [X, y] на наборы для обучения и тестирования.Предполагается, что обучающий набор представляет собой случайный выбор из 120 случайно сгенерированных точек данных.Вот как я генерирую обучающий набор:
nTrain = 120
maxIndex = len(X)
randomTrainingSamples = np.random.choice(maxIndex, nTrain, replace=False)
trainX = X[randomTrainingSamples, :] # training samples
trainY = y[randomTrainingSamples, :] # labels of training samples nTrain X 1
Теперь я не могу понять, как получить набор для тестирования, который представляет собой 130 других случайно сгенерированных точек данных, которыене включены в учебный набор:
testX = # testing samples
testY = # labels of testing samples nTest x 1
Предложения очень ценятся.Спасибо!