Хотите ли вы 1000 кластеров изображений, или объектов, или пар (изображений, объектов)?
В любом случае это звучит так, как будто вам придется уменьшить данные
и использовать более простые методы.
Одна возможность - двухпроходный K-кластер:
а) разделить 2 миллиона точек данных на 32 кластера,
б) разделить каждый из них на 32 больше.
Если это работает, результирующие кластеры 32 ^ 2 = 1024 могут быть достаточно хороши для вашей цели.
Тогда вам действительно нужны 100 координат?
Можете ли вы угадать 20 самых важных,
или просто попробуйте случайные подмножества из 20?
Существует огромная литература: Google +image "dimension reduction"
дает ~ 70000 показов.