Вы должны построить кривую обучения для обучающего и тестового набора с разными размерами дерева. Это минимальный код для этого. Затем вы проверяете на соответствие, сравнивая две строки.
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
import matplotlib.pyplot as plt
from matplotlib.legend_handler import HandlerLine2D
train_results = []
test_results = []
list_nb_trees = [5, 10, 15, 30, 45, 60, 80, 100]
for nb_trees in list_nb_trees:
rf = RandomForestRegressor(n_estimators=nb_trees)
rf.fit(X_train, y_train)
train_results.append(mean_squared_error(y_train, rf.predict(X_train)))
test_results.append(mean_squared_error(y_test, rf.predict(X_test)))
line1, = plt.plot(list_nb_trees, train_results, color="r", label="Training Score")
line2, = plt.plot(list_nb_trees, test_results, color="g", label="Testing Score")
plt.legend(handler_map={line1: HandlerLine2D(numpoints=2)})
plt.ylabel('MSE')
plt.xlabel('n_estimators')
plt.show()