Всегда говорят, что деревья KD отлично подходят для поиска ближайших соседей.Однако, если ваш набор данных - это все дискретные значения, без реальной метрики расстояния, они все еще эффективны?
Например, если ваши атрибуты были чем-то вроде [black, blue, red], [bread, milk, cheese], [right, left, straight, curved]
Нет преемственности, и единственный способ измерить расстояние - это расстояние Хэмминга (где мы проверяем, сколько из них эквивалентно примеру тестирования).Деревья KD все еще эффективно сохраняются в этих сценариях?Как получилось?