Я пытаюсь сделать линейную модель в sklearn, и поэтому я хочу проверить модель, которую я реализовал, используя некоторые функции ошибок.
Сначала я выбрал функции для моей оси X
и y
.
#Predict the average parking rates per month
X = df[['Number of weekly riders', 'Price per week',
'Population of city', 'Monthly income of riders']]
y = df['Average parking rates per month']
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
#only 20% test size because we are working with a small dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=101)
lm = LinearRegression()
lm.fit(X_train, y_train)
после того, как я установил модель, я пытаюсь использовать некоторые функции ошибок из пакета metrics
из sklearn
, но, очевидно, я не могу использовать ни одну из функций, потому что не существует одинакового количества данных испытаний и поездов
print('Mean Absolute Error:', metrics.mean_absolute_error(y_test, y_train))
print('Mean Squared Error:', metrics.mean_squared_error(y_test, y_train))
print('Root Mean Squared Error:', np.sqrt(metrics.mean_squared_error(y_test, y_train)))
ValueError: Found input variables with inconsistent numbers of samples: [6, 21]
действительно ли так, что вам нужен одинаковый размер данных поезда и испытаний для запуска функция ошибок?