Python SKLearn данные тренировочных тестов - PullRequest
0 голосов
/ 04 июня 2019

Я впервые работаю над машинным обучением.У меня есть задание для запуска логистической и байесовской регрессии из Sklearn на доходности яблочных запасов и сравнение с линейной регрессией + тензорным потоком.Я не уверен, правильно ли я понимаю, что перед запуском логистической регрессии я должен обучить свой набор данных.Я пытался сделать так, чтобы мои данные выглядели так:

Closing_Price   Daily_Returns   Daily_Returns_1 Daily_Returns_2 Daily_Returns_3 Daily_Returns_4 Daily_Returns_5
Date                            
1980-12-22  0.53    0.058269    0.040822    0.042560    0.021979    -0.085158   -0.040005
1980-12-23  0.55    0.037041    0.058269    0.040822    0.042560    0.021979    -0.085158
1980-12-24  0.58    0.053110    0.037041    0.058269    0.040822    0.042560    0.021979
1980-12-26  0.63    0.082692    0.053110    0.037041    0.058269    0.040822    0.042560
1980-12-29  0.64    0.015748    0.082692    0.053110    0.037041    0.058269    0.040822

Когда я запускаю

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.2)

я получаюошибка, что NameError: name 'X' is not defined

Ваша помощь очень ценится.Заранее спасибо за ваше время.

1 Ответ

0 голосов
/ 04 июня 2019

Посмотрел много видео на YouTube по какой-то причине, они скучают, рассказывая вам это.Должны определять X и y как:

X = apple['Closing_Price'].values.reshape(-1,1)

y = apple['Daily_Returns'].values.reshape(-1,1)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...