Машинное обучение лайнера Регресс - Склеарн - PullRequest
0 голосов
/ 11 марта 2019

Я новичок в области машинного обучения, и в изучении регрессии у меня есть некоторые сомнения

1: во время практики метода предсказания регрессионной модели обучения склеарна получается ошибка, показанная ниже.

Код:

sklearn.linear_model.LinearRegression.predict(25)

Ошибка: "ValueError: Ожидаемый двумерный массив, вместо него получен скалярный массив: array = 25. Измените ваши данные, используя array.reshape (-1, 1), если ваши данные имеют один объект, или array.reshape (1, -1), если он содержит один образец. "

Нужно ли передавать двумерный массив? Проверено на странице документации sklearn ни один не нашел ничего для обновления версии. ** Запуск моего кода на Kaggle
https://www.kaggle.com/aman9d/bikesharingdemand-upx/

2: будет ли индекс набора данных влиять на оценку модели (веса)?

1 Ответ

0 голосов
/ 11 марта 2019

Прежде всего вы должны поставить свой код, как вы используете:

# import, instantiate, fit
from sklearn.linear_model import LinearRegression
linreg = LinearRegression()
linreg.fit(X, y)

# use the predict method
linreg.predict(25)

Поскольку то, что вы публикуете в вопросе, не выполняется должным образом, метод predict не является статическим для класса LinearRegression.

Когда вы подбираете модель, первым шагом является распознавание того, какой тип данных будет входным, в вашем случае это будет похоже на X, это означает, что если вы передадите что-то с другой формой X в Модель это вызовет ошибку.

В вашем примере X представляется экземпляром pd.DataFrame () только с 1 столбцом, его следует заменить на массив из 2 измерений, представляющий количество примеров числом объектов, поэтому если вы попробуете:

linreg.predict([[25]])

должно работать.

Например, если вы пытались регрессировать с более чем одним признаком, например, столбцом, скажем, temp и humidity, ваш ввод будет выглядеть следующим образом:

linreg.predict([[25, 56]])

Надеюсь, это поможет вам и всегда помните, какова форма ваших данных.

Документация: Подход LinearRegression

X: массивоподобная или разреженная матрица, форма (n_samples, n_features)

...