Я использую вложения doc2vec аминокислотных последовательностей, чтобы попытаться предсказать кинетическую скорость.
Я пробовал как стандартизировать, так и не стандартизировать свои входные векторы (X), но если я нестандартизируя мою выходную переменную (кинетические скорости), моя модель GP предсказывает очень похожие числа для всех входных данных теста (между 4,87 и 4,9) ?
Предполагается ли стандартизировать выходные значения или что-то не так с моей моделью?
Я использую пакет GPy в Python.
Это мой код:
#GP Regression for word vectors
def Gp_regression(Xtrain, Ytrain, Xtest, Ytest):
kernel = GPy.kern.RBF(input_dim = 64, variance = 1, lengthscale = 1)
m = GPy.models.GPRegression(Xtrain, Ytrain, kernel=kernel, noise_var=1e-10)
m.optimize_restarts(num_restarts = 10)
Xtest = np.ndarray(shape=(1,64))
mean = m.predict(Xtest)
return mean