Я выполняю классификацию URL (фишинг - не фишинг), и я построил кривые обучения (тренировка или оценка перекрестной проверки) для моей модели (повышение градиента).
My View
Кажется, что эти две кривые сходятся, и разница не является существенной. Это нормально для тренировочного набора, чтобы иметь немного более высокую точность). (рисунок 1)
Вопрос
У меня ограниченный опыт вмашинное обучение, поэтому я спрашиваю ваше мнение. Правильно ли я подхожу к проблеме? У этой модели все в порядке или она переоснащается?
Примечание: классы сбалансированы и функции хорошо выбраны
Соответствующий код
from yellowbrick.model_selection import LearningCurve
def plot_learning_curves(Χ, y, model):
# Create the learning curve visualizer
cv = StratifiedKFold(n_splits=5)
sizes = np.linspace(0.1, 1.0, 8)
visualizer = LearningCurve(model, cv=cv, train_sizes=sizes, n_jobs=4)
visualizer.fit(Χ, y) # Fit the data to the visualizer
visualizer.poof()