ValueError: Найдены входные переменные с непоследовательным количеством выборок: [11097, 1233] - PullRequest
0 голосов
/ 02 февраля 2020

Я пытаюсь создать торговый сайт и использовать sklearn для распознавания паттернов в сделках в python 3.6. Я получаю данные с веб-сайта следующим образом:

buyer = "FORM54"
getBuyer = requests.get("https://url.com/buyer=%s/" % buyer)

Затем с помощью pandas получаю нужные мне данные:

data = pd.read_json(StringIO(getBuyer.text))
data = data[["strike_price", "underlying_price", "notional_amount", "quantity"]]

и пытаюсь предсказать количество сделок, например, так :

predict = "quantity"
X = np.array(data.drop([predict],1))
y = np.array(data[predict])

x_train, y_train, x_test, y_test = sklearn.model_selection.train_test_split(X, y, test_size =  0.1)

Однако я получаю эту ошибку:

Traceback (most recent call last):
  File "C:/Users/HP Omen/PycharmProjects/untitled2/main.py", line 31, in <module>
    model.fit(x_train, y_train)
  File "C:\Users\HP Omen\PycharmProjects\untitled2\venv\lib\site-packages\sklearn\neighbors\_base.py", line 1130, in fit
    X, y = check_X_y(X, y, "csr", multi_output=True)
  File "C:\Users\HP Omen\PycharmProjects\untitled2\venv\lib\site-packages\sklearn\utils\validation.py", line 765, in check_X_y
    check_consistent_length(X, y)
  File "C:\Users\HP Omen\PycharmProjects\untitled2\venv\lib\site-packages\sklearn\utils\validation.py", line 212, in check_consistent_length
    " samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [11097, 1233]

Это X и Y формы:

>>> X.shape
(12330, 3)
>>> y.shape
(12330,)

Однако это меняется, когда buyer изменяется

1 Ответ

0 голосов
/ 02 февраля 2020

Попробуйте:

x_train, x_test, y_train, y_test = sklearn.model_selection.train_test_split(X, y, test_size =  0.1)

и посмотрите, решит ли это вашу проблему.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...