Как сделать прогноз, используя набор данных жилья Бостона? - PullRequest
0 голосов
/ 11 марта 2020

Я работаю над учебником по прогнозированию цен на жилье. Код работает, но я пытаюсь сделать прогноз для нового, неизвестного массива, но продолжаю получать ошибки.

import pandas as pd
import numpy as np
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston
boston = load_boston()

reg = linear_model.LinearRegression()
x_train, x_test, y_train, y_test = train_test_split(df_x, df_y, test_size=0.33, random_state=42)

reg.fit(x_train, y_train)

Код работает, но я хочу проверить на новом примере:

X_new = [['15.7','20.5','18.9', '21.7', '20.4', '18.2', '19.9', '23.1', '17.5', '20.2', '18.2', 
'13.6', '19.6']]

reg.predict(X_new)

Я получаю следующее сообщение об ошибке: «UFuncTypeError: ufun c 'matmul' не содержит al oop с типами соответствия сигнатуры (dtype ('dtype ('

I'm I'm) не уверен, что я делаю неправильно. Нужно ли менять X_new на список строк или сохранять их в виде numpy массива?

1 Ответ

0 голосов
/ 11 марта 2020

Я думаю, мне нужно было изменить массив на float, чтобы получить результат: my_array = np.array (X_new, dtype = float) reg.predict (my_array)]

мой результат выглядит следующим образом: массив ([[29.99003492]])

Для набора данных жилья в Бостоне, я умножу 30 на 10000, чтобы получить прогнозируемую цену на жилье? так 300 000 - это прогнозируемая цена дома?

...