Как сделать 10-кратную перекрестную проверку с размером тестового набора в Python - PullRequest
0 голосов
/ 27 мая 2019

Как построить модель машинного обучения для прогнозирования ожидаемого SpendValue для клиента, используя функцию LinearRegression()

Также измерьте производительность модели с помощью 10-кратной перекрестной проверки с размером тестового набора 20%.

enter image description here

X = sales.drop(['SpendValue'], axis=1).values
y = sales.SpendValue.values
print("The training dataset has {} examples and {} features.".format(X.shape[0], X.shape[1]))
lr = LinearRegression()
kfolds = KFold(n_splits=10, random_state=42, shuffle=False)
for train, test in kfolds.split(X):
    print("Train Index: ", train, "\n")
    print("Test Index: ", test)

Я не уверен, где упомянуть размер теста и как перейти к прогнозу ожидаемого Spendvalue для клиента, а также к отображению различных показателей производительности

1 Ответ

0 голосов
/ 27 мая 2019

Я хотел бы начать объяснение перекрестной проверки и разделения на поезда и тесты, которое было объяснено здесь .

enter image description here

Во-первых, вам нужно разделить тесты на поезда (что-то вроде следующего)

>>> X_train, X_test, y_train, y_test = train_test_split(
...     X, y, test_size=0.20, random_state=42)

Затем выполнить перекрестную проверку набора обучающих данных, а также у вас есть набор тестовых данных размером 20% от исходного набора данных.,

kfolds = KFold(n_splits=10, random_state=42, shuffle=False)
for train, test in kfolds.split(X_train):
    print("Train Index: ", train, "\n")
    print("Test Index: ", test)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...