KD-дерево плохо работает для многомерных данных, и 128 измерений будут довольно высокими. KD-дерево индексирует каждое измерение на различном уровне дерева, и при выполнении запроса алгоритм будет выполнять многоуровневое отслеживание (поиск по обеим сторонам ветви) и заканчивает поиск большинства точек в дереве. Когда это происходит, преимущества использования древовидной структуры исчезают, и исчерпывающее сравнение завершается быстрее.
Возможно, вы захотите найти существующую систему поиска сходства изображений, в которую вы можете отобразить свои данные. Вот тот, который называется Lire , который извлекает элементы из изображений и индексирует их с помощью Lucene.
Если ваша работа в большей степени ориентирована на исследования, вы, возможно, захотите прочитать показатели метрического пространства и приблизительный поиск k-ближайших соседей.