Я пытаюсь создать торговый сайт и использовать sklearn для распознавания паттернов в сделках в python 3.6. Я получаю данные с веб-сайта следующим образом:
buyer = "FORM54"
getBuyer = requests.get("https://url.com/buyer=%s/" % buyer)
Затем с помощью pandas получаю нужные мне данные:
data = pd.read_json(StringIO(getBuyer.text))
data = data[["strike_price", "underlying_price", "notional_amount", "quantity"]]
и пытаюсь предсказать количество сделок, например, так :
predict = "quantity"
X = np.array(data.drop([predict],1))
y = np.array(data[predict])
x_train, y_train, x_test, y_test = sklearn.model_selection.train_test_split(X, y, test_size = 0.1)
Однако я получаю эту ошибку:
Traceback (most recent call last):
File "C:/Users/HP Omen/PycharmProjects/untitled2/main.py", line 31, in <module>
model.fit(x_train, y_train)
File "C:\Users\HP Omen\PycharmProjects\untitled2\venv\lib\site-packages\sklearn\neighbors\_base.py", line 1130, in fit
X, y = check_X_y(X, y, "csr", multi_output=True)
File "C:\Users\HP Omen\PycharmProjects\untitled2\venv\lib\site-packages\sklearn\utils\validation.py", line 765, in check_X_y
check_consistent_length(X, y)
File "C:\Users\HP Omen\PycharmProjects\untitled2\venv\lib\site-packages\sklearn\utils\validation.py", line 212, in check_consistent_length
" samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [11097, 1233]
Это X и Y формы:
>>> X.shape
(12330, 3)
>>> y.shape
(12330,)
Однако это меняется, когда buyer
изменяется