Недостаточная экипировка - PullRequest
0 голосов
/ 10 февраля 2019

Таким образом, в рамках моего задания я применяю линейную и лассо-регрессию, и вот вопрос 7.

На основании оценок из вопроса 6, какое значение гаммы соответствует модели, которая являетсянедостаточная комплектация (и имеет ли худшая точность набора тестов)?Какое значение гаммы соответствует модели, которая соответствует требованиям (и имеет худшую точность набора тестов)?Какой выбор гаммы будет лучшим выбором для модели с хорошими показателями обобщения в этом наборе данных (высокая точность как для обучения, так и для набора тестов)?

Подсказка: попробуйте построить результаты из вопроса 6, чтобы визуализировать взаимосвязь междугамма и точность.Не забудьте закомментировать строку импорта matplotlib перед отправкой.

Эта функция должна возвращать один кортеж со значениями степеней в следующем порядке: (Underfitting, Overfitting, Good_Generalization) Обратите внимание, что есть только одинправильное решение.

Мне действительно нужна помощь, я не могу придумать, как решить этот последний вопрос.Какой код я должен использовать, чтобы определить (Подгонка, Переоснащение, Good_Generalization) и почему ???

Спасибо,

Набор данных: http://archive.ics.uci.edu/ml/datasets/Mushroom?ref=datanews.io

Вот мойкод из вопроса 6:

from sklearn.svm import SVC
from sklearn.model_selection import validation_curve

def answer_six():
    # SVC requires kernel='rbf', C=1, random_state=0 as instructed
    # C: Penalty parameter C of the error term
    # random_state: The seed of the pseudo random number generator 
    # used when shuffling the data for probability estimates
    # e radial basis function kernel, or RBF kernel, is a popular 
    # kernel function used in various kernelized learning algorithms, 
    # In particular, it is commonly used in support vector machine 
    # classification

    model = SVC(kernel='rbf', C=1, random_state=0)

    # Return numpy array numbers spaced evenly on a log scale (start, 
    # stop, num=50, endpoint=True, base=10.0, dtype=None, axis=0)

    gamma = np.logspace(-4,1,6)

    # Create a Validation Curve for model and subsets.
    # Create parameter name and range regarding gamma. Test Scoring 
    # requires accuracy. 
    # Validation curve requires X and y.

    train_scores, test_scores = validation_curve(model, X_subset, y_subset, param_name='gamma', param_range=gamma, scoring ='accuracy')

    # Determine mean for scores and tests along columns (axis=1)
    sc = (train_scores.mean(axis=1), test_scores.mean(axis=1))                                                 

    return sc

answer_six() 

1 Ответ

0 голосов
/ 10 февраля 2019

Ну, ознакомьтесь с переоснащением.Вы должны произвести что-то вроде этого: Статья на эту тему graph

Слева у вас есть подтяжка, справа с подтяжка ... Где обаошибки низкие у вас есть хорошее обобщение.

И эти вещи являются функцией гаммы (регуляризатора)

...