Проблемы с регрессионной моделью - PullRequest
0 голосов
/ 11 апреля 2020

У меня проблемы с домашним заданием. У меня есть набор данных пользователей и их рейтинги для фильмов. Я создал pandas фрейм данных, который выглядит следующим образом: Here is an image of a portion of the dataframe

Я разделил фрейм данных на обучающее подмножество (75%) и тестовое подмножество. Я создал модели (Лассо, LinearRegression, Ридж ..). Теперь моя работа - создать своего собственного пользователя и оценить некоторые фильмы. Затем протестируйте модели на моем пользователе, чтобы убедиться в правильности прогнозов. Тем не менее, я понятия не имею, как проверить это только на моем пользователе. Я добавил своего пользователя в фрейм данных. Далее я немного потерян.

df["672"] = uporabnik
train=df.sample(frac=0.75,random_state=200)
test=df.drop(train.index)

#users.append("672")
mse = []
for i in users:
    x = np.array(train.drop(columns=["movieId", "title", i]), dtype='float')
    y = np.array(train.filter([i]), dtype='float')

    x_test = np.array(test.drop(columns=["movieId", "title", i]), dtype='float')
    y_test = np.array(test.filter([i]), dtype='float')

    model = Lasso(alpha=0.1)
    model.fit(x,y)
    hx = model.predict(x_test)
    mse.append(mean_squared_error(hx,y_test))
    MSE = mean_squared_error(hx,y_test)
    if(MSE > 0 and MSE < 1):
        if(i == '672'):
            print(hx)

Вот код, который у меня есть для этой проблемы.

Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...