Я пытаюсь сделать то, что показывает следующее изображение в R:
Учитывая два класса, где "-" это большинство и "+" - это меньшинство, найдите k ближайших большинства / "-" соседей каждого + и преобразуйте кластеры в новый второй класс (*). Цель этого состоит в том, чтобы синтетически сбалансировать данные для лучшей классификации.
Я использовал KNN в прошлом, но никогда не хотел выделять только другую переменную.
Редактировать : Пример ввода и вывода
Вот пример того, что мне нужно, где k = 3 и есть 2 функции для каждого класса. Однако мои данные являются конфиденциальными и имеют более 100 функций.