Модель регрессии ГП Прогнозирование очень похожих чисел для всех входов теста - PullRequest
0 голосов
/ 11 июля 2019

Я использую вложения doc2vec аминокислотных последовательностей, чтобы попытаться предсказать кинетическую скорость.

Я пробовал как стандартизировать, так и не стандартизировать свои входные векторы (X), но если я нестандартизируя мою выходную переменную (кинетические скорости), моя модель GP предсказывает очень похожие числа для всех входных данных теста (между 4,87 и 4,9) ?

Предполагается ли стандартизировать выходные значения или что-то не так с моей моделью?

Я использую пакет GPy в Python.

Это мой код:

#GP Regression for word vectors
def Gp_regression(Xtrain, Ytrain, Xtest, Ytest):

    kernel = GPy.kern.RBF(input_dim = 64, variance = 1, lengthscale =    1)
    m = GPy.models.GPRegression(Xtrain, Ytrain, kernel=kernel,    noise_var=1e-10)
    m.optimize_restarts(num_restarts = 10)

    Xtest = np.ndarray(shape=(1,64))
    mean = m.predict(Xtest)

return mean
...