Прежде чем приступить к созданию счетчика по инерции, я бы посоветовал вам подумать, если это хорошая идея. Инерция_ это сумма квадратов расстояния образцов до ближайших центров кластеров. Гипотетически, даже если вам каким-то образом удастся использовать это в качестве своего счетчика, вы всегда получите max (n_clusters) в качестве результата поиска по сетке. Вот почему я верю, что это произойдет.
Если вы построите эту инерцию по оси Y для кластеров разных размеров, в левом конце графика значение inertia_ будет равно дисперсии, поскольку у вас будет центр кластера в качестве среднего значения данных и SSE для всех выборки с этим средним значением будут f (дисперсия). С правой стороны, если у вас будет столько кластеров, сколько число сэмплов, вы получите inertia_ = 0. Это значение будет монотонно убывающей функцией при увеличении кластера. Наилучшим параметром сетки с этой оценкой всегда будет максимальное количество кластеров. Я не считаю это очень полезным. Пожалуйста, дайте мне знать, если я что-то упустил.