Ошибка значения при подгонке модели линейной регрессии - PullRequest
0 голосов
/ 03 мая 2018

Я начал делать прогнозную модель для конвертации USD в INR. Я разбил данные, преобразовал даты в порядковый формат и поместил их в модель LinearRegression.

import pandas as pd
from sklearn import linear_model
import matplotlib.pyplot as plt
import datetime as dt
data = pd.read_csv("FED-RXI_N_M_IN.csv")
rates = {}
rates = {'date':[x for x in data.Date],
         'rate':[y for y in data.Value]}
df = pd.DataFrame(rates, columns = ["date", "rate"])
dates = df['date']
rates = df['rate']
dates = pd.to_datetime(dates)
dates = dates.map(dt.datetime.toordinal)

#train data
dates_test = dates[0:110]
rates_test = rates[0:110]

#test data
dates_train = dates[110:543]
rates_train = rates[110:543]

plt.plot_date(dates_test, rates_test, fmt="g-")
plt.title('US-INR Currency Predictor')
plt.ylabel("INR rate against $1")
plt.xlabel("Date")

#training
regr = linear_model.LinearRegression()
regr.fit(dates_train,rates_train)
rates_pred = regr.predict(dates_test)
plt.scatter(dates_test, rates_test,  color='black')
plt.title('Test Data')
plt.xlabel('Date')
plt.ylabel('Rate')
plt.plot(dates_test, rates_pred, color = 'red', linewidth= 3)
plt.xticks(())
plt.yticks(())
plt.show()
print( str((regr.predict(736753))) )

Я получаю эту ошибку на regr.fit(dates_train,rates_train)

enter image description here

Пожалуйста, помогите мне, как решить это. Я новичок в этой области.

1 Ответ

0 голосов
/ 03 мая 2018

Похоже, sklearn требует форму данных (row number, column number). Для этого вы можете использовать метод reshape.

Кроме того, вам необходимо передать массив numpy в качестве входных данных для метода fit.

rates = df['rate'].values.reshape(len(df.index), 1)   

#train data
dates_test = dates[0:110, :]
rates_test = rates[0:110, :]

#test data
dates_train = dates[110:543, :]
rates_train = rates[110:543, :]
...