Это очень нестандартная вариация k-средних. Таким образом, вы не можете ожидать, что sklearn будет подготовлен для каждого экзотического варианта. Это сделает склеарн медленнее для всех остальных.
Фактически, ваш подход больше похож на определенные регрессионные подходы (прогнозирование последнего значения центров кластеров), чем на кластеризацию. Я также сомневаюсь, что результаты будут намного лучше, чем просто установить последнее значение на среднее значение всех точек, назначенных центру кластера, используя только остальные 6 измерений. Попробуйте разбить данные на основе ближайшего центра (игнорируя последний столбец), а затем установите в последнем столбце среднее арифметическое назначенных данных.
Однако, sklearn - это с открытым исходным кодом .
Итак, получите исходный код и измените k-means. Инициализируйте последний компонент случайным образом, и во время работы k-means обновляет только последний столбец. Это легко изменить таким способом - но очень сложно разработать эффективный API, позволяющий такие настройки через тривиальные параметры - используйте исходный код для настройки на его уровне.