У меня небольшая проблема с предварительной обработкой моего кода.У меня есть набор данных, содержащий все цены закрытия рынка S & P500.Я пытаюсь стандартизировать поезд и установить, взяв среднее и стандартное.Но я думаю, что делаю некоторые ошибки.
Можете ли вы взглянуть, пожалуйста!
def split_into_chunks(data, train, predict, step, scale=True):
X, Y = [], []
for i in range(0, len(data), step):
try:
x_i = data[i:i+train]
y_i = data[i+train+predict]
timeseries = np.array(data[i:i+train])
mean = np.mean(timeseries)
std = np.std(timeseries)
if scale:
timeseries = preprocessing.scale(timeseries)
y_i = ((y_i - np.mean(x_i)) / np.std(x_i))
x_i2 = timeseries
y_i = np.array(y_i)
except:
break
X.append(x_i2)
Y.append(y_i)
return X, Y
Я пытался напечатать x_i2
и y_i
означает, но они не равны 0.
Я получаю значения, такие как: -8.0657702739e-15 -3.29597460436e-15 -8.16013923099e-16 -4.18554080284e-15 1.52655665886e-14 -1.4313550345e-14 9.6325725174e-15 -2.87436741075e-14 1.25038868148e-15 -9.3008933888e-15 1.1901590824e-14 -1.55653268052e-14 3.73923114694e-14 -4.32986979604e-15 9.79216707719e-15 2.90878432452e-15 -4.56301663121e-15 5.59552404411e-15 2.00062189037e-14 5.58442181386e-15 8.53761505937e-15 -5.95634652711e-15 -7.58282325819e-15 -5.66213742559e-15 -5.10702591328e-16 -1.37667655054e-15
........
Это для x_i2, в то время как для y_i у меня есть случайные значения -
я напечаталтакже стандартное значение x_i2 и всегда 1, так что я думаю, что это правильно.В то время как для y_i у меня есть значения, которые совершенно разные: если я распечатаю, то получаю: -1.45773439337 -0.67365790704 -0.840543321934 -0.561634875724 -0.0619854889473 1.02192562934 -0.335794754645 1.7104392559 1.70865656323 1.37444452634 0.374673787665 -0.749332397315
........
В то время как стандартное значение всегда равно 0.
anyпомощь приветствуется